admin 管理员组

文章数量: 887021

朴素贝叶斯(西瓜数据集分类,社区恶意留言分类,垃圾邮件分类,新浪新闻分类),AODE分类器 代码实现

以下代码为本人学习后,修改或补充后的代码实现,数据集和原代码请参考:https://github/Jack-Cherish/Machine-Learning

西瓜数据集分类

import numpy as np
from math import exp, sqrt, pi


def getDataSet():
    dataSet = [
        ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, 1],
        ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, 1],
        ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, 1],
        ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, 1],
        ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, 1],
        ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, 1],
        ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, 1],
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, 1],
        ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, 0],
        ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, 0],
        ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, 0],
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, 0],
        ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, 0],
        ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, 0],
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, 0],
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, 0],
        ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, 0]
    ]

    features = ['色泽', '根蒂', '敲声', '纹理', '脐部', '触感', '密度', '含糖量']

    featureDic = {}
    for i in range(len(features)):
        featureList = [example[i] for example in dataSet]
        uniqueFeature = list(set(featureList))
        featureDic[features[i]] = uniqueFeature

    dataSet = np.array(dataSet)
    return dataSet, features, featureDic              # 返回数据集,特征词,特征元素


def countProLap(dataSet, index, value, classLabel, N):        # 拉普拉斯平滑
    extrData = dataSet[dataSet[:, -1] == classLabel]
    count = 0
    for data in extrData:
        if data[index] == value:
            count += 1
    return (count + 1) / (float(len(extrData)) + N)


def trainNB0(dataSet, features, featureDic):
    dict = {}                                          # 求类条件概率
    for feature in features:
        index = features.index(feature)
        dict[feature] = {}
        if feature != '密度' and feature != '含糖量':
            featIList = featureDic[feature]
            for value in featIList:
                PisCond = countProLap(dataSet, index, value, '1', len(featIList))
                pNoCond = countProLap(dataSet, index, value, '0', len(featIList))
                dict[feature][value] = {}
                dict[feature][value]["是"] = PisCond
                dict[feature][value]["否"] = pNoCond
        else:
            for label in ['1', '0']:
                dataExtra = dataSet[dataSet[:, -1] == label]
                extr = dataExtra[:, index].astype("float64")
                aver = extr.mean()
                var = extr.var()

                labelStr = ""
                if label == '1':
                    labelStr = '是'
                else:
                    labelStr = '否'

                dict[feature][labelStr] = {}
                dict[feature][labelStr]["平均值"] = aver
                dict[feature][labelStr]["方差"] = var

    length = len(dataSet)                                 # 求类先验概率
    classLabels = dataSet[:, -1].tolist()
    dict["好瓜"] = {}
    dict["好瓜"]['是'] = (classLabels.count('1') + 1) / (float(length) + 2)
    dict["好瓜"]['否'] = (classLabels.count('0') + 1) / (float(length) + 2)
    return dict


def NormDist(mean, var, xi):
    return exp(-((float(xi) - mean) ** 2) / (2 * var)) / (sqrt(2 * pi * var))


def classifyNB(data, features, bayesDis):
    pGood = bayesDis['好瓜']['是']
    pBad = bayesDis['好瓜']['否']
    for feature in features:
        index = features.index(feature)
        if feature != '密度' and feature != '含糖量':
            pGood *= bayesDis[feature][data[index]]['是']
            pBad *= bayesDis[feature][data[index]]['否']
        else:
            pGood *= NormDist(bayesDis[feature]['是']['平均值'], bayesDis[feature]['是']['方差'], data[index])
            pBad *= NormDist(bayesDis[feature]['否']['平均值'], bayesDis[feature]['否']['方差'], data[index])
    retClass = ""
    if pGood > pBad:
        retClass = "好瓜"
    else:
        retClass = "坏瓜"

    return pGood, pBad, retClass


def test_accuracy(dataSet, features, bayesDis):          # 精确率
    cnt = 0.0
    for data in dataSet:
        _, _, pre = classifyNB(data, features, bayesDis)
        if (pre == '好瓜' and data[-1] == '1') or (pre == '坏瓜' and data[-1] == '0'):
            cnt += 1
    return cnt / float(len(dataSet))


def main():
    dataSet, features, featureDic = getDataSet()
    dic = trainNB0(dataSet, features,featureDic)
    for each in dic.items():
        print(each)
    p1, p0, pre = classifyNB(dataSet[0], features, dic)
    print(f"p1 = {p1}")
    print(f"p0 = {p0}")
    print(f"pre = {pre}")
    print("train data set accuracy = ", test_accuracy(dataSet, features, dic))


if __name__ == '__main__':
    main()
('色泽', {'乌黑': {'是': 0.45454545454545453, '否': 0.25}, '青绿': {'是': 0.36363636363636365, '否': 0.3333333333333333}, '浅白': {'是': 0.18181818181818182, '否': 0.4166666666666667}})
('根蒂', {'硬挺': {'是': 0.09090909090909091, '否': 0.25}, '蜷缩': {'是': 0.5454545454545454, '否': 0.3333333333333333}, '稍蜷': {'是': 0.36363636363636365, '否': 0.4166666666666667}})
('敲声', {'浊响': {'是': 0.6363636363636364, '否': 0.4166666666666667}, '清脆': {'是': 0.09090909090909091, '否': 0.25}, '沉闷': {'是': 0.2727272727272727, '否': 0.3333333333333333}})
('纹理', {'稍糊': {'是': 0.18181818181818182, '否': 0.4166666666666667}, '模糊': {'是': 0.09090909090909091, '否': 0.3333333333333333}, '清晰': {'是': 0.7272727272727273, '否': 0.25}})
('脐部', {'稍凹': {'是': 0.36363636363636365, '否': 0.3333333333333333}, '凹陷': {'是': 0.5454545454545454, '否': 0.25}, '平坦': {'是': 0.09090909090909091, '否': 0.4166666666666667}})
('触感', {'硬滑': {'是': 0.7, '否': 0.6363636363636364}, '软粘': {'是': 0.3, '否': 0.36363636363636365}})
('密度', {'是': {'平均值': 0.57375, '方差': 0.014608437499999998}, '否': {'平均值': 0.49611111111111117, '方差': 0.03370254320987655}})
('含糖量', {'是': {'平均值': 0.27875, '方差': 0.008912437500000002}, '否': {'平均值': 0.1542222222222222, '方差': 0.010328617283950618}})
('好瓜', {'是': 0.47368421052631576, '否': 0.5263157894736842})
p1 = 0.02180124640594357
p0 = 4.915834021416594e-05
pre = 好瓜
train data set accuracy =  0.8235294117647058

社区恶意留言分类

import numpy as np


def loadDataSet():                                                                    # 创建实验样本
    postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],          # 切分的词条
                 ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],
                 ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                 ['stop', 'posting', 'stupid', 'worthless', 'garbage'],
                 ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],
                 ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]
    classVec = [0,1,0,1,0,1]                                                          # 类别标签向量,1代表侮辱性词汇,0代表不是
    return postingList,classVec


# 将切分的实验样本词条整理成不重复的词条列表,也就是词汇表,用来将词条向量化
def createVocabList(dataSet):
    vocabSet = set([])                                    # 创建一个空的不重复集合
    for document in dataSet:
        vocabSet = vocabSet | set(document)               # 取并集
    return list(vocabSet)


def setOfWords2Vec(vocabList, inputSet):                  # 根据vocabList词汇表,将inputSet向量化,向量的每个元素为1或0
    returnVec = [0] * len(vocabList)                      # 创建一个其中所含元素都为0的向量
    for word in inputSet:                                 # 遍历每个词条
        if word in vocabList:                             # 如果词条存在于词汇表中,则置1
            returnVec[vocabList.index(word)] = 1
        else: print("the word: %s is not in my Vocabulary!" % word)
    return returnVec                                      # 返回文档向量


def trainNB0(trainMatrix,trainCategory):                       # 朴素贝叶斯分类器训练函数
    numTrainDocs = len(trainMatrix)                            # 计算训练的文档数目
    numWords = len(trainMatrix[0])                             # 计算每篇文档的词条数
    pAbusive = sum(trainCategory)/float(numTrainDocs)          # 文档属于侮辱类的概率,相当于先验概率(P(侮辱类))
    p0Num = np.ones(numWords); p1Num = np.ones(numWords)     # 创建numpy.ones数组,拉普拉斯平滑(如果设置为zeros,那么其中一个概率为0,那么最后乘积也为0)
    p0Denom = 2.0; p1Denom = 2.0                               # 分母初始化为2
    for i in range(numTrainDocs):
        if trainCategory[i] == 1:                     # 统计属于侮辱类的条件概率所需的数据,即P(w0|1),P(w1|1),P(w2|1)···
            p1Num += trainMatrix[i]
            p1Denom += sum(trainMatrix[i])
        else:                                     # 统计属于非侮辱类的条件概率所需的数据,即P(w0|0),P(w1|0),P(w2|0)···
            p0Num += trainMatrix[i]
            p0Denom += sum(trainMatrix[i])
    p0Vect = np.log(p0Num/p0Denom)              # 条件概率对数化,防止下溢出
    p1Vect = np.log(p1Num/p1Denom)
    return p0Vect,p1Vect,pAbusive                 # 返回属于非侮辱类的条件概率数组,属于侮辱类的条件概率数组,文档属于侮辱类的概率


def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):         # 朴素贝叶斯分类器分类函数
    p1 = sum(vec2Classify * p1Vec) + np.log(pClass1)             # 对应元素相乘 log(A*B)=log(A)+log(B)
    p0 = sum(vec2Classify * p0Vec) + np.log(1-pClass1)
    print('p0:',p0)
    print('p1:',p1)
    if p1 > p0:
        return 1
    else:
        return 0


def testingNB():
    listOPosts,listClasses = loadDataSet()									# 创建实验样本
    myVocabList = createVocabList(listOPosts)								# 创建词汇表
    trainMat=[]
    for postinDoc in listOPosts:
        trainMat.append(setOfWords2Vec(myVocabList, postinDoc))				# 将实验样本向量化

    p0V,p1V,pAb = trainNB0(np.array(trainMat),np.array(listClasses))		# 训练朴素贝叶斯分类器

    testEntry = ['love', 'my', 'him','so']									# 测试样本1
    thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))				# 测试样本向量化
    if classifyNB(thisDoc,p0V,p1V,pAb):
        print(testEntry,'属于侮辱类')										    # 执行分类并打印分类结果
    else:
        print(testEntry,'属于非侮辱类')										# 执行分类并打印分类结果

    testEntry = ['stupid', 'garbage']										# 测试样本2
    thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))				# 测试样本向量化
    if classifyNB(thisDoc,p0V,p1V,pAb):
        print(testEntry,'属于侮辱类')										    # 执行分类并打印分类结果
    else:
        print(testEntry,'属于非侮辱类')										# 执行分类并打印分类结果

    testEntry = ['I','love','him']                              # 测试样本3
    thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))              # 测试样本向量化
    if classifyNB(thisDoc, p0V, p1V, pAb):
        print(testEntry, '属于侮辱类')                                        # 执行分类并打印分类结果
    else:
        print(testEntry, '属于非侮辱类')                                      # 执行分类并打印分类结果


if __name__ == '__main__':
    testingNB()
p0: -9.854332321737983
p1: -12.178089750893692
['love', 'my', 'him', 'so'] 属于非侮辱类
p0: -7.20934025660291
p1: -4.702750514326955
['stupid', 'garbage'] 属于侮辱类
p0: -7.982530144836391
p1: -9.13356731317027
['I', 'love', 'him'] 属于非侮辱类

垃圾邮件分类

import numpy as np
import random
import re


def createVocabList(dataSet):
    vocabSet = set([])  					                         # 创建一个空的不重复集合
    for document in dataSet:
        vocabSet = vocabSet | set(document)                          # 取并集
    return list(vocabSet)


def setOfWords2Vec(vocabList, inputSet):
    returnVec = [0] * len(vocabList)									# 创建一个其中所含元素都为0的向量
    for word in inputSet:												# 遍历每个词条
        if word in vocabList:											# 如果词条存在于词汇表中,则置1
            returnVec[vocabList.index(word)] = 1
        else: print("the word: %s is not in my Vocabulary!" % word)
    return returnVec													# 返回文档向量


def bagOfWords2VecMN(vocabList, inputSet):
    returnVec = [0]*len(vocabList)										# 创建一个其中所含元素都为0的向量
    for word in inputSet:												# 遍历每个词条
        if word in vocabList:											# 如果词条存在于词汇表中,则计数加一
            returnVec[vocabList.index(word)] += 1
    return returnVec


def trainNB0(trainMatrix,trainCategory):
    numTrainDocs = len(trainMatrix)                         # 计算训练集的数目
    numWords = len(trainMatrix[0])							# 计算每封邮件的词条数
    pAbusive = sum(trainCategory)/float(numTrainDocs)		# 属于垃圾邮件的概率
    p0Num = np.ones(numWords); p1Num = np.ones(numWords)	# 创建numpy.ones数组,词条出现数初始化为1,拉普拉斯平滑
    p0Denom = 2.0; p1Denom = 2.0                        	# 分母初始化为2,拉普拉斯平滑
    for i in range(numTrainDocs):
        if trainCategory[i] == 1:							# 统计属于垃圾类的条件概率所需的数据,即P(w0|1),P(w1|1),P(w2|1)···
            p1Num += trainMatrix[i]
            p1Denom += sum(trainMatrix[i])
        else:												# 统计属于非垃圾类的条件概率所需的数据,即P(w0|0),P(w1|0),P(w2|0)···
            p0Num += trainMatrix[i]
            p0Denom += sum(trainMatrix[i])
    p0Vect = np.log(p0Num/p0Denom)
    p1Vect = np.log(p1Num/p1Denom)							# 取对数,防止下溢出
    return p0Vect,p1Vect,pAbusive							# 返回属于非垃圾类的条件概率数组,属于垃圾类的条件概率数组,邮件属于垃圾类的概率


def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):
    p1 = sum(vec2Classify * p1Vec) + np.log(pClass1)    	# 对应元素相乘。logA * B = logA + logB,所以这里加上log(pClass1)
    p0 = sum(vec2Classify * p0Vec) + np.log(1.0 - pClass1)
    if p1 > p0:
        return 1
    else:
        return 0


def textParse(bigString):                                                   # 将字符串转换为字符列表
    # 这里使用\W 或者\W+ 都可以将字符数字串分割开,产生的空字符将会在后面的列表推导式中过滤掉
    listOfTokens = re.split(r'\W+', bigString)                              # 将特殊符号作为切分标志进行字符串切分,即非字母、非数字
    return [tok.lower() for tok in listOfTokens if len(tok) > 2]            # 除了单个字母,例如大写的I,其它单词变成小写


def spamTest():
    docList = []; classList = []
    for i in range(1, 26):                                                  # 遍历25个txt文件
        wordList = textParse(open('spam/%d.txt' % i, 'r').read())     # 读取每个垃圾邮件,并字符串转换成字符串列表
        docList.append(wordList)
        classList.append(1)                                                 # 标记垃圾邮件,1表示垃圾文件
        wordList = textParse(open('ham/%d.txt' % i, 'r').read())      # 读取每个非垃圾邮件,并字符串转换成字符串列表
        docList.append(wordList)
        classList.append(0)                                                 # 标记非垃圾邮件,0表示非垃圾文件

    vocabList = createVocabList(docList)                                 # 创建词汇表,不重复

    errorrate = 0

    for i in range(10):                                                         # 迭代10次求平均错误率
        trainingSet = list(range(50)); testSet = []                             # 创建存储训练集的索引值的列表和测试集的索引值的列表
        for i in range(10):                                                     # 从50个邮件中,随机挑选出40个作为训练集,10个做测试集
            randIndex = int(random.uniform(0, len(trainingSet)))                # 随机选取索索引值
            testSet.append(trainingSet[randIndex])                              # 添加测试集的索引值
            del(trainingSet[randIndex])                                         # 在训练集列表中删除添加到测试集的索引值

        trainMat = []; trainClasses = []                                        # 创建训练集矩阵和训练集类别标签系向量
        for docIndex in trainingSet:                                            # 遍历训练集
            trainMat.append(setOfWords2Vec(vocabList, docList[docIndex]))       # 将生成的词集模型添加到训练矩阵中
            trainClasses.append(classList[docIndex])                            # 将类别添加到训练集类别标签系向量中

        p0V, p1V, pSpam = trainNB0(np.array(trainMat), np.array(trainClasses))  # 训练朴素贝叶斯模型

        errorCount = 0                                                          # 错误分类计数
        for docIndex in testSet:                                                # 遍历测试集
            wordVector = setOfWords2Vec(vocabList, docList[docIndex])           # 测试集的词集模型
            if classifyNB(np.array(wordVector), p0V, p1V, pSpam) != classList[docIndex]:    # 如果分类错误
                errorCount += 1                                                 # 错误计数加1
                print("分类错误的测试集:",docList[docIndex],end=" ")
                if classList[docIndex]:
                    print(docList[docIndex], '属于正常文件')
                else:
                    print(docList[docIndex], '属于垃圾文件')
            elif classifyNB(np.array(wordVector), p0V, p1V, pSpam):
                print(docList[docIndex], '属于垃圾文件')  # 执行分类并打印分类结果
            else:
                print(docList[docIndex], '属于正常文件')
        print('错误率:%.2f%%' % (float(errorCount) / len(testSet) * 100))
        errorrate += float(errorCount) / len(testSet) * 100
    print('10次总的错误率为:%.2f%%' % errorrate)
    print('平均错误率为:%.2f%%' % (errorrate / 10))


if __name__ == '__main__':
    spamTest()
['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
['arvind', 'thirumalai', 'commented', 'your', 'status', 'arvind', 'wrote', 'you', 'know', 'reply', 'this', 'email', 'comment', 'this', 'status'] 属于正常文件
['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
['this', 'mail', 'was', 'sent', 'from', 'notification', 'only', 'address', 'that', 'cannot', 'accept', 'incoming', 'mail', 'please', 'not', 'reply', 'this', 'message', 'thank', 'you', 'for', 'your', 'online', 'reservation', 'the', 'store', 'you', 'selected', 'has', 'located', 'the', 'item', 'you', 'requested', 'and', 'has', 'placed', 'hold', 'your', 'name', 'please', 'note', 'that', 'all', 'items', 'are', 'held', 'for', 'day', 'please', 'note', 'store', 'prices', 'may', 'differ', 'from', 'those', 'online', 'you', 'have', 'questions', 'need', 'assistance', 'with', 'your', 'reservation', 'please', 'contact', 'the', 'store', 'the', 'phone', 'number', 'listed', 'below', 'you', 'can', 'also', 'access', 'store', 'information', 'such', 'store', 'hours', 'and', 'location', 'the', 'web', 'http', 'www', 'borders', 'com', 'online', 'store', 'storedetailview_98'] 属于正常文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
分类错误的测试集: ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] 属于正常文件
['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
错误率:10.00%
['will', 'there', 'the', 'latest'] 属于正常文件
['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
['thanks', 'peter', 'definitely', 'check', 'this', 'how', 'your', 'book', 'going', 'heard', 'chapter', 'came', 'and', 'was', 'good', 'shape', 'hope', 'you', 'are', 'doing', 'well', 'cheers', 'troy'] 属于正常文件
['buy', 'ambiem', 'zolpidem', '5mg', '10mg', 'pill', 'pills', '129', 'pills', '199', '180', 'pills', '430', 'pills', '138', '120', 'pills', '322'] 属于垃圾文件
['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
错误率:10.00%
['saw', 'this', 'the', 'way', 'the', 'coast', 'thought', 'might', 'like', 'hangzhou', 'huge', 'one', 'day', 'wasn', 'enough', 'but', 'got', 'glimpse', 'went', 'inside', 'the', 'china', 'pavilion', 'expo', 'pretty', 'interesting', 'each', 'province', 'has', 'exhibit'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order', 'save', 'off', 'quality', 'watches'] 属于垃圾文件
['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
['will', 'there', 'the', 'latest'] 属于正常文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
错误率:0.00%
['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
['buyviagra', '25mg', '50mg', '100mg', 'brandviagra', 'femaleviagra', 'from', 'per', 'pill', 'viagranoprescription', 'needed', 'from', 'certified', 'canadian', 'pharmacy', 'buy', 'here', 'accept', 'visa', 'amex', 'check', 'worldwide', 'delivery'] 属于垃圾文件
['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
['ryan', 'whybrew', 'commented', 'your', 'status', 'ryan', 'wrote', 'turd', 'ferguson', 'butt', 'horn'] 属于正常文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
['codeine', 'the', 'most', 'competitive', 'price', 'net', 'codeine', 'wilson', '30mg', '156', 'codeine', 'wilson', '30mg', '291', 'freeviagra', 'pills', 'codeine', 'wilson', '30mg', '396', 'freeviagra', 'pills', 'codeine', 'wilson', '30mg', '120', '492', 'freeviagra', 'pills'] 属于垃圾文件
错误率:0.00%
['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
['yay', 'you', 'both', 'doing', 'fine', 'working', 'mba', 'design', 'strategy', 'cca', 'top', 'art', 'school', 'new', 'program', 'focusing', 'more', 'right', 'brained', 'creative', 'and', 'strategic', 'approach', 'management', 'the', 'way', 'done', 'today'] 属于正常文件
['jay', 'stepp', 'commented', 'your', 'status', 'jay', 'wrote', 'the', 'reply', 'this', 'email', 'comment', 'this', 'status', 'see', 'the', 'comment', 'thread', 'follow', 'the', 'link', 'below'] 属于正常文件
['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
['ordercializviagra', 'online', 'save', '0nline', 'pharmacy', 'noprescription', 'required', 'buy', 'canadian', 'drugs', 'wholesale', 'prices', 'and', 'save', 'fda', 'approved', 'drugs', 'superb', 'quality', 'drugs', 'only', 'accept', 'all', 'major', 'credit', 'cards'] 属于垃圾文件
['there', 'was', 'guy', 'the', 'gas', 'station', 'who', 'told', 'that', 'knew', 'mandarin', 'and', 'python', 'could', 'get', 'job', 'with', 'the', 'fbi'] 属于正常文件
['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
['thought', 'about', 'this', 'and', 'think', 'possible', 'should', 'get', 'another', 'lunch', 'have', 'car', 'now', 'and', 'could', 'come', 'pick', 'you', 'this', 'time', 'does', 'this', 'wednesday', 'work', 'can', 'have', 'signed', 'copy', 'you', 'book'] 属于正常文件
错误率:0.00%
['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
['ordercializviagra', 'online', 'save', '0nline', 'pharmacy', 'noprescription', 'required', 'buy', 'canadian', 'drugs', 'wholesale', 'prices', 'and', 'save', 'fda', 'approved', 'drugs', 'superb', 'quality', 'drugs', 'only', 'accept', 'all', 'major', 'credit', 'cards'] 属于垃圾文件
['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
['there', 'was', 'guy', 'the', 'gas', 'station', 'who', 'told', 'that', 'knew', 'mandarin', 'and', 'python', 'could', 'get', 'job', 'with', 'the', 'fbi'] 属于正常文件
['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
['peter', 'the', 'hotels', 'are', 'the', 'ones', 'that', 'rent', 'out', 'the', 'tent', 'they', 'are', 'all', 'lined', 'the', 'hotel', 'grounds', 'much', 'for', 'being', 'one', 'with', 'nature', 'more', 'like', 'being', 'one', 'with', 'couple', 'dozen', 'tour', 'groups', 'and', 'nature', 'have', 'about', '100m', 'pictures', 'from', 'that', 'trip', 'can', 'through', 'them', 'and', 'get', 'you', 'jpgs', 'favorite', 'scenic', 'pictures', 'where', 'are', 'you', 'and', 'jocelyn', 'now', 'new', 'york', 'will', 'you', 'come', 'tokyo', 'for', 'chinese', 'new', 'year', 'perhaps', 'see', 'the', 'two', 'you', 'then', 'will', 'thailand', 'for', 'winter', 'holiday', 'see', 'mom', 'take', 'care'] 属于正常文件
错误率:10.00%
['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
['yay', 'you', 'both', 'doing', 'fine', 'working', 'mba', 'design', 'strategy', 'cca', 'top', 'art', 'school', 'new', 'program', 'focusing', 'more', 'right', 'brained', 'creative', 'and', 'strategic', 'approach', 'management', 'the', 'way', 'done', 'today'] 属于正常文件
['what', 'going', 'there', 'talked', 'john', 'email', 'talked', 'about', 'some', 'computer', 'stuff', 'that', 'went', 'bike', 'riding', 'the', 'rain', 'was', 'not', 'that', 'cold', 'went', 'the', 'museum', 'yesterday', 'was', 'get', 'and', 'they', 'had', 'free', 'food', 'the', 'same', 'time', 'was', 'giants', 'game', 'when', 'got', 'done', 'had', 'take', 'the', 'train', 'with', 'all', 'the', 'giants', 'fans', 'they', 'are', 'drunk'] 属于正常文件
['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] 属于正常文件
['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
错误率:10.00%
['peter', 'the', 'hotels', 'are', 'the', 'ones', 'that', 'rent', 'out', 'the', 'tent', 'they', 'are', 'all', 'lined', 'the', 'hotel', 'grounds', 'much', 'for', 'being', 'one', 'with', 'nature', 'more', 'like', 'being', 'one', 'with', 'couple', 'dozen', 'tour', 'groups', 'and', 'nature', 'have', 'about', '100m', 'pictures', 'from', 'that', 'trip', 'can', 'through', 'them', 'and', 'get', 'you', 'jpgs', 'favorite', 'scenic', 'pictures', 'where', 'are', 'you', 'and', 'jocelyn', 'now', 'new', 'york', 'will', 'you', 'come', 'tokyo', 'for', 'chinese', 'new', 'year', 'perhaps', 'see', 'the', 'two', 'you', 'then', 'will', 'thailand', 'for', 'winter', 'holiday', 'see', 'mom', 'take', 'care'] 属于正常文件
分类错误的测试集: ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] 属于正常文件
['linkedin', 'kerry', 'haloney', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'like', 'add', 'you', 'professional', 'network', 'linkedin', 'kerry', 'haloney'] 属于正常文件
['will', 'there', 'the', 'latest'] 属于正常文件
['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
错误率:10.00%
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
分类错误的测试集: ['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] ['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] 属于垃圾文件
错误率:20.00%
['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
['buy', 'ambiem', 'zolpidem', '5mg', '10mg', 'pill', 'pills', '129', 'pills', '199', '180', 'pills', '430', 'pills', '138', '120', 'pills', '322'] 属于垃圾文件
['linkedin', 'kerry', 'haloney', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'like', 'add', 'you', 'professional', 'network', 'linkedin', 'kerry', 'haloney'] 属于正常文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
['buyviagra', '25mg', '50mg', '100mg', 'brandviagra', 'femaleviagra', 'from', 'per', 'pill', 'viagranoprescription', 'needed', 'from', 'certified', 'canadian', 'pharmacy', 'buy', 'here', 'accept', 'visa', 'amex', 'check', 'worldwide', 'delivery'] 属于垃圾文件
['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
['thanks', 'peter', 'definitely', 'check', 'this', 'how', 'your', 'book', 'going', 'heard', 'chapter', 'came', 'and', 'was', 'good', 'shape', 'hope', 'you', 'are', 'doing', 'well', 'cheers', 'troy'] 属于正常文件
['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order', 'save', 'off', 'quality', 'watches'] 属于垃圾文件
['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
错误率:0.00%
10次总的错误率为:70.00%
平均错误率为:7.00%

新浪新闻分类

from sklearn.naive_bayes import MultinomialNB
import matplotlib.pyplot as plt
import os
import random
import jieba


def TextProcessing(folder_path, test_size=0.2):
    folder_list = os.listdir(folder_path)                  # 查看folder_path下的文件
    data_list = []  # 数据集数据
    class_list = []  # 数据集类别

    # 遍历每个子文件夹
    for folder in folder_list:
        new_folder_path = os.path.join(folder_path, folder)    # 根据子文件夹,生成新的路径
        files = os.listdir(new_folder_path)                    # 存放子文件夹下的txt文件的列表

        j = 1
        for file in files:   # 遍历每个txt文件
            if j > 100:      # 每类txt样本数最多100个
                break
            with open(os.path.join(new_folder_path, file), 'r', encoding='utf-8') as f:    # 打开txt文件
                raw = f.read()

            word_cut = jieba.cut(raw, cut_all=False)      # 精简模式,返回一个可迭代的generator
            word_list = list(word_cut)                    # generator转换为list

            data_list.append(word_list)             # 添加数据集数据
            class_list.append(folder)               # 添加数据集类别
            j += 1

    data_class_list = list(zip(data_list, class_list))   # zip压缩合并,将数据与标签对应压缩
    random.shuffle(data_class_list)                   # 将data_class_list乱序
    index = int(len(data_class_list) * test_size) + 1  # 训练集和测试集切分的索引值
    train_list = data_class_list[index:]        # 训练集
    test_list = data_class_list[:index]           # 测试集
    train_data_list, train_class_list = zip(*train_list)    # 训练集解压缩
    test_data_list, test_class_list = zip(*test_list)     # 测试集解压缩

    all_words_dict = {}                # 统计训练集词频,建立一个空字典,键值对
    for word_list in train_data_list:     # 遍历每个列表
        for word in word_list:              # 遍历每个单词
             if word in all_words_dict.keys():
                all_words_dict[word] += 1
             else:
                all_words_dict[word] = 1
    # 根据键的值倒序排序
    all_words_tuple_list = sorted(all_words_dict.items(), key=lambda f: f[1], reverse=True)   # sorted返回的是一个新的列表
    all_words_list, all_words_nums = zip(*all_words_tuple_list)  # 解压缩
    all_words_list = list(all_words_list)  # 转换成列表
    return all_words_list, train_data_list, test_data_list, train_class_list, test_class_list   # 训练词汇表,训练集,测试集,训练标签,测试标签


def MakeWordsSet(words_file):
    words_set = set()      # 创建set集合
    with open(words_file, 'r', encoding='utf-8') as f:  # 打开文件
        for line in f.readlines():  # 一行一行读取
            word = line.strip()  # 去回车
            if len(word) > 0:  # 有文本,则添加到words_set中
                words_set.add(word)
    return words_set  # 返回处理结果


# 根据feature_words将文本向量化
def TextFeatures(train_data_list, test_data_list, feature_words):
    def text_features(text, feature_words):  # 出现在特征集中,则置1
        text_words = set(text)                     # 首先对text去重,没有重复的值,作为词汇表
        features = [1 if word in text_words else 0 for word in feature_words]
        return features

    train_feature_list = [text_features(text, feature_words) for text in train_data_list]
    test_feature_list = [text_features(text, feature_words) for text in test_data_list]
    return train_feature_list, test_feature_list  # 训练集,测试集向量化


def words_dict(all_words_list, deleteN, stopwords_set):
    feature_words = []  # 特征列表
    n = 1
    for t in range(deleteN, len(all_words_list), 1):
        if n > 1000:  # feature_words的维度为1000
            break
        # 如果这个词不是数字,并且不是指定的结束语,并且单词长度大于1小于5,那么这个词就可以作为特征词
        if not all_words_list[t].isdigit() and all_words_list[t] not in stopwords_set and 1 < len(all_words_list[t]) < 5:
            feature_words.append(all_words_list[t])
        n += 1
    return feature_words


# 新闻分类器
def TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list):
    classifier = MultinomialNB().fit(train_feature_list, train_class_list)
    test_accuracy = classifier.score(test_feature_list, test_class_list)
    return test_accuracy

if __name__ == '__main__':
    # 文本预处理
    folder_path = './SogouC/Sample'  # 训练集存放地址
    all_words_list, train_data_list, test_data_list, train_class_list, test_class_list = TextProcessing(folder_path)
    # 生成stopwords_set
    stopwords_file = './stopwords_cn.txt'
    stopwords_set = MakeWordsSet(stopwords_file)

    test_accuracy_list = []
    '''
    deleteNs = range(0, 1000, 20)  # 0 20 40 60 ... 980
    for deleteN in deleteNs:
        feature_words = words_dict(all_words_list, deleteN, stopwords_set)
        train_feature_list, test_feature_list = TextFeatures(train_data_list, test_data_list, feature_words)
        test_accuracy = TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list)
        test_accuracy_list.append(test_accuracy)
    '''
    feature_words = words_dict(all_words_list, 450, stopwords_set)
    train_feature_list, test_feature_list = TextFeatures(train_data_list, test_data_list, feature_words)
    test_accuracy = TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list)
    test_accuracy_list.append(test_accuracy)
    ave = lambda c: sum(c) / len(c)
    print(ave(test_accuracy_list))

    clt = MultinomialNB()
    clt.fit(train_feature_list,train_class_list)
    final_class_list = list(zip(test_data_list, clt.predict(test_feature_list)))     # zip压缩合并,将测试数据与标签对应压缩
    for each in final_class_list:
        print(each)
    '''
    plt.figure()
    plt.plot(deleteNs, test_accuracy_list)
    plt.title('Relationship of deleteNs and test_accuracy')
    plt.xlabel('deleteNs')
    plt.ylabel('test_accuracy')
    plt.show()
    '''
0.5263157894736842
(['\u3000', '\u3000', '本报讯', ' ', '全球', '最大', '个人电脑', '制造商', '戴尔公司', '8', '日', '说', ',', '由于', '市场竞争', '激烈', ',', '以及', '定价', '策略', '不当', ',', '该', '公司', '今年', '第一季度', '盈利', '预计', '有所', '下降', '。', '消息', '发布', '之后', ',', '戴尔', '股价', '一度', '下跌', '近', '6', '%', ',', '创下', '一年', '来', '的', '新低', '。', '\n', '\u3000', '\u3000', '戴尔公司', '估计', ',', '其', '第一季度', '收入', '约', '为', '1', '4', '2', '亿美元', ',', '每股', '收益', '3', '3', '美分', '。', '此前', '公司', '预测', '当季', '收入', '为', '1', '4', '2', '亿至', '1', '4', '6', '亿美元', ',', '每股', '收益', '3', '6', '至', '3', '8', '美分', ',', '而', '分析师', '平均', '预测', '戴尔', '同期', '收入', '为', '1', '4', '5', '.', '2', '亿美元', ',', '每股', '收益', '3', '8', '美分', '。', '\n', '\u3000', '\u3000', '为', '抢夺', '失去', '的', '市场份额', ',', '戴尔公司', '一些', '产品', '打折', '力度', '很大', '。', '戴尔公司', '首席', '执行', '官凯文', '·', '罗林斯', '在', '一份', '声明', '中说', ',', '公司', '在', '售后服务', '和', '产品质量', '方面', '一直', '在', '投资', ',', '同时', '不断', '下调', '价格', '。', '戴尔公司', '将', '于', '5', '月', '1', '8', '日', '公布', '第一季度', '的', '财报', '。'], 'C000010')
(['\n', '\u3000', '\u3000', '刚刚', '在', '上', '周六', '以', '0', '比', '2', '惨败', '在', '长春队', '脚下', '的', '沈足', ',', '今天下午', '将', '在', '客场', '挑战', '升班马', '厦门', '蓝狮', ',', '尽管', '在', '此前', ',', '沈足', '曾', '在', '换帅', '之后', '创造', '了', '三连胜', '和', '四轮', '不败', '的', '骄人', '战绩', ',', '但', '随着', '上', '一轮', '主场', '失利', ',', '使得', '沈足', '刚刚', '赢来', '的', '保级', '优势', '顿时', '化为乌有', ',', '对此', ',', '沈足', '俱乐部', '总经理', '何兵', '表示', ':', '“', '过去', '的', '胜利', '已经', '成为', '过去', ',', '我们', '现在', '必须', '要', '冷静', '地', '面对现实', ',', '从', '现在', '开始', ',', '我们', '打', '的', '每', '一场', '比赛', '都', '是', '保级战', ',', '特别', '是', '跟', '厦门', '这样', '的', '保级', '球队', '作战', ',', '我们', '更是', '要', '全力', '争胜', '。', '”', '\n', '\u3000', '\u3000', '为了', '提前', '适应', '厦门', '当地', '的', '天气', '和', '场地', ',', '沈足', '在', '本周一', '就', '抵达', '厦门', ',', '开始', '了', '赛前', '备战', ',', '尽管', '在', '上', '一轮', '遭遇', '惨败', ',', '但', '沈足', '将士', '却', '并', '没有', '因此', '灰心丧气', ',', '相反', ',', '随着', '许博', '、', '普科', '两名', '绝对', '主力', '的', '回归', ',', '全队', '对', '本轮', '挑战', '厦门', '蓝狮', '充满', '了', '必胜', '的', '信心', ',', '场上', '队长', '汪强', '告诉', '记者', ':', '“', '我们', '上', '一轮', '输给', '长春', '其实', '很', '正常', ',', '一方面', '我们', '缺少', '了', '两名', '主力', '队员', ',', '另一方面', '今年', '长春队', '非常', '强', ',', '他们', '现在', '排名', '第二', '就', '足以', '说明', '他们', '非常', '有', '实力', '。', '不过', ',', '本轮', '和', '厦门队', '比赛', ',', '我们', '还是', '非常', '有', '信心', '拿', '下来', ',', '今年', '厦门队', '的', '实力', '并', '不是', '很强', ',', '虽然', '客场', '比赛', '有些', '困难', ',', '但', '我们', '全队', '的', '目标', '非常', '明确', ',', '就是', '全取', '3', '分', ',', '最坏', '也', '要', '带', '着', '1', '分', '回来', '。', '”', '\n', '\u3000', '\u3000', '许博', '和', '普科', '的', '回归', '也', '令', '主教练', '库夫曼', '感到', '非常高兴', ',', '因为', '他', '又', '可以', '派出', '他', '最', '满意', '的', '主力阵容', '出战', '。', '对于', '今天', '的', '比赛', ',', '库夫曼', '表示', ':', '“', '厦门队', '已经', '几轮', '没有', '赢球', '了', ',', '我', '想', '他们', '对', '这场', '比赛', '也', '会', '虎视眈眈', ',', '但', '中国', '有句', '俗话', '是', '狭路相逢', '勇者胜', ',', '到时候', '就', '看', '我们', '谁', '更', '顽强', '吧', '。', '”', '\n', '\u3000', '\u3000', '本报记者', '刘淼', '报道'], 'C000014')
(['\u3000', '\u3000', '科龙德', '勤案', '又', '有', '新进展', ':', '已有', '多位', '科龙', 'H股', '股东', '到', '律师', '处', '咨询', '、', '登记', ',', '所涉', '股份', '达', '200', '余万股', '。', '而', '这些', '投资者', '正在', '为', '等待', '提起', '民事', '赔偿', '所', '需', '的', '前置条件', '焦急', '等待', '。', '\n', '\u3000', '\u3000', '4', '月', '29', '日', ',', '上海', '新', '望闻达', '律师', '事务所律师', '宋一欣', '、', '秦桢凯', '在', '中国', '证券', '网上', '发表', '了', '《', '向', '境内', '外科', '龙', 'H股', '投资者', '征集', '民事', '赔偿', '诉讼', '代理', '的', '启事', '》', ',', '全面', '接受', '科龙电器', '流通', 'H股', '及', 'A股', '投资者', '的', '诉讼', '及', '仲裁', '委托', '代理', '事项', '。', '宋一欣', '律师', '告诉', '《', '上海', '证券报', '》', '记者', ',', '“', '《', '启事', '》', '刊登', '当天', ',', '就', '有', 'H股', '股东', '前来', '咨询', '登记', ',', '由于', '五一', '长假', ',', '事务所', '休息', ',', '许多', 'H股', '股东', '想方设法', '找到', '我', '的', '电子信箱', '同', '我', '联系', '。', '截至', '今天', ',', '已有', '七八位', 'H股', '股东', '前来', '咨询', '、', '登记', ',', '所', '涉及', '股份', '己', '达', '50', '余万股', ',', '损失', '金额', '有待', '统计', '。', '这些', 'H股', '股东', '中有', '境外', '居民', '。', '他们', '正', '焦急', '等待', '此案', '前置程序', '的', '满足', '。', '”', '\n', '\u3000', '\u3000', '首位', '代表', '科龙', '股东', '状告', '德勤', '的', '上海市', '光明', '律师', '事务所', '南京', '分', '所', '律师', '涂勇则', '向', '记者', '透露', ':', '“', '多位', '科龙', 'H股', '股东', '前来', '向', '我', '咨询', '起诉', '事宜', '。', '其中', '一位', '就', '持有', '150', '万股', '科龙', 'H股', ',', '持股', '成本', '高达', '300', '多万元', '。', '他', '非常', '渴望', '前置程序', '能', '尽快', '满足', ',', '以便', '诉上', '公堂', '。', '”', '\n', '\u3000', '\u3000', '据', '宋一欣', '介绍', ',', '“', '根据', '最高人民法院', '司法解释', '的', '规定', ',', '提起', '虚假', '陈述', '民事', '赔偿', '诉讼', '必须', '满足', '前置条件', ',', '即', '中国证监会', '或', '财政部', '的', '行政处罚', '决定', ',', '或', '有关', '法院', '认定', '有罪', '并', '生效', '的', '刑事', '判决书', ',', '两者', '以先', '出台', '者', '为准', '。', '”', '\n', '\u3000', '\u3000', '“', '在', '科龙案', '中', ',', '中国证监会', '已经', '对', '科龙电器', '与', '德勤', '会计师', '事务所', '进行', '了', '行政处罚', '前', '的', '听证', '程序', ',', '如果', '没有', '意外', ',', '估计', '今年', '上半年', '内', '行政处罚', '决定', '将', '出台', ';', '而', '顾雏军', '编制', '虚假', '财务报告', '罪案', '已经', '被', '广东省', '佛山市', '人民检察院', '立案', '、', '即将', '提起公诉', ',', '刑事', '审判', '在', '即', '。', '因此', ',', '包括', 'H股', '股东', '在内', '的', '科龙电器', '权益', '受损', '的', '投资者', '提起', '民事', '赔偿', '应该', '不成问题', ',', '只是', '需要', '等待', ',', '万事俱备', '、', '只欠东风', '。', '”', '宋一欣', '进一步', '解释', '道', '。', '\n', '\u3000', '\u3000', '谈及', '此案', '的', '被告', ',', '宋一欣', '表示', ',', '“', '科龙电器', '虚假', '陈述', '可', '涉及', '很多', '被告', ',', '如', '科龙电器', '公司', ';', '顾雏军', '等', '原', '董事', '、', '高管', '人员', '及', '直接', '责任人员', ';', '存在', '失职', '的', '原', '监事会', '成员', '和', '独立', '董事', ';', '进行', '审计', '的', '会计师', '事务所', '(', '会计师', '行', ')', '及其', '承担责任', '的', '合伙人', '、', '相关', '注册', '会计师', ';', '由于', '虚假', '陈述', '而', '获益', '的', '关联', '企业', '、', '控股', '股东', '等', '。', '但', '主要', '被告', '有', '三', ',', '即', '科龙电器', '公司', '、', '顾雏军', '、', '德勤华', '永', '会计师', '事务所', '(', 'A股', '股东', ')', '或德勤', '·', '关黄陈', '会计师', '行', '(', 'H股', '股东', ')', '。', '”', '\n', '\u3000', '\u3000', '宋一欣', '称', ',', '“', '证券', '民事', '赔偿', '诉讼', '应当', '采取', '目前', '《', '民事', '诉讼法', '》', '规定', '的', '共同', '诉讼', '方式', ',', '科龙案', '也', '是', '如此', '。', '以', '共同', '诉讼', '提起', '的', '原告', '由于', '合并', '后', '按', '比例', '计算', '诉讼费', ',', '故其', '支出', '的', '诉讼费', '要', '比', '单独', '诉讼', '提起', '的', '原告', '所', '支付', '的', '诉讼费', '要少', '。', '所以', ',', '作为', '代理律师', ',', '从', '投资者', '的', '角度', '考虑', ',', '我', '需要', '筹集', '到', '一定', '数量', '投资者', '委托', '后', '才', '安排', '起诉', '。', '”', '(', '本报记者', ' ', '岳敬飞', ' ', '何军', ')'], 'C000013')
(['\n', '\u3000', '\u3000', '【', '来源', ':', ' ', '太奇', 'MBA', '】', '\n', '\u3000', '\u3000', '数学', '各门', '课', '的', '特点', '及', '复习', '对策', '\n', '\u3000', '\u3000', '从', '考生', '总结', '一句', '话', ':', '得数', '学者', '得', '天下', '。', '在', '复习', '的', '过程', '中', ',', '要', '针对', '不同', '的', '课程', '复习', '特点', '进行', '复习', '。', '初数', '部分', '知识点', '少', '(', '主要', '就是', '绝对值', ',', '不等式', '和', '方程', ',', '数列', ',', ')', ',', '概念', '简单', '(', '大部分', '都', '是', '在', '高', '中学', '过', '的', ')', ',', '技巧性', '强', '(', '同样', '一种', '题', '可以', '用', '很', '多种', '方法', '去', '分析', ')', ',', '题型', '变换', '性强', '(', '同一个', '知识点', '可以', '引申', '出', '很多', '题型', ')', ',', '所以', '这部分', '考试', '容易', '失分', ',', '做题', '的', '时候', '一定', '要', '细心', '。', '每年', '考试', '往往', '不是', '最难', '的', '部分', '如', '微积分', '失分', '最', '多', ',', '而是', '初等数学', '部分', '失分', '最', '多', ',', '稍微', '一不留神', '就会少', '考虑', '一个', '条件', '。', '初数', '部分', '的', '复习', '对策', '就是', '抓', '重点', ',', '也', '就是', '抓', '必考题', '型', '(', '如', '绝对值', '、', '不等式', '和', '方程', '、', '数列', '每年', '必考', ')', ',', '然后', '以点带面', ',', '复习', '其它', '次', '重点', '的', '部分', '(', '比如', '二项式', '定理', '、', '比', '和', '比例', ')', '。', '在', '平时', '做', '这部分', '练习', '的', '时候', ',', '大家', '一定', '要', '开阔', '自己', '的', '思路', ',', '千万', '不要', '一', '上来', '就', '按', '传统', '的', '方法', '求解', '。', '比如', '有', '一道', '题', '是', '这样', '的', ':', '用', '绳子', '量井深', ',', '把', '绳子', '折于', '三折', ',', '井外', '余绳', ' ', '\n', '4', ' ', '尺', ',', '把', '绳子', '折于', '四折', ',', '井外', '余绳', ' ', '1', ' ', '\n', '尺', ',', '求井深', '?', '很多', '同学', '在', '做', '这道题', '的', '时候', ',', '一', '上来', '就', '设', '两个', '未知', '变量', ',', '列', '方程组', ',', '然后', '费', '了', '很', '长时间', '才', '把', '答案', '解', '出来', '。', '其实', '你', '考虑一下', ',', '当', '三折', '量井', '的', '时候', ',', '相当于', '余绳', ' ', '3', '×', '4', ' ', '=', ' ', '\n', '12', ' ', '尺', ',', '当', '四折', '量井', '的', '时候', ',', '相当于', '余绳', ' ', '4', '×', '1', ' ', '=', ' ', '4', ' ', '尺', ',', '然后', '口', '算', '出井', '深', '为', ' ', '12', ' ', '-', ' ', '4', ' ', '=', ' ', '8', ' ', '\n', '尺', '。', '初数', '中', '类似', '这样', '的', '题', '很多', ',', '常见', '的', '还有', '甲乙', '两人', '围绕', '跑道', '相向', '而行', '的', '相遇', '追及', '问题', '等等', '。', '通过', '这个', '简单', '的', '例子', '说明', ',', '大家', '在', '学', '初数', '的', '时候', ',', '一定', '要', '“', '灵活', '”', ',', '透过', '试题', '表面', '找到', '等量', '关系', '。', '\n', '\u3000', '\u3000', '微积分', '这部分', '知识点', '很多', ',', '占', '整个', '数学', '知识点', '的', '三分之一', '以上', ',', '概念', '抽象', ',', '需要', '很强', '的', '抽象思维', '能力', ',', '并且', '重', '逆向', '思维', '(', '尤其', '体现', '在', '极值', '的', '充分性', '和', '必要性', ')', ',', '技巧性', '较强', ',', '题型', '变幻莫测', ',', '是', '数学', '中', '最难', '的', '一部分', ',', '所以', '容易', '失分', '。', '建议', '大家', '在', '复习', '这', '一部分', '的', '时候', ',', '多', '做', '一些', '充分性', '判断题', ',', '因为', '一定', '要', '训练', '自己', '的', '逆向', '思维能力', ',', '只有', '这样', '才能', '在', '有限', '的', '时间', '内', '分析', '问题', '的', '时候', '做到', '游刃有余', '。', '还', '一点', '是', '要', '注意', '微积分', '知识点', '之间', '的', '相互', '联系', ',', '比如', '连续', '、', '可导', '、', '微分', '之间', '的', '关系', ',', '以及', '驻点', '、', '极值', '点', '、', '最值', '点', '之间', '的', '关系', '等', '。', '关于', '微积分', '的', '复习', ',', '可以', '按照', '我', '总结', '的', '几句话', '为', '方向', '进行', '复习', ',', '这', '就是', ':', '\n', '\u3000', '\u3000', '极限', '是', '基础', ' ', '(', ' ', '是', '建立', '连续', '、', '导数', '的', '基础', ' ', ')', '\n', '\u3000', '\u3000', '连续', '是', '条线', ' ', '(', ' ', '联系', '了', '导数', '与', '积分', ' ', ')', '\n', '\u3000', '\u3000', '导数', '是', '关键', ' ', '(', ' ', '概念', '必考', ',', '导数', '的', '应用', '考', '计算', ' ', ')', '\n', '\u3000', '\u3000', '积分', '考', '计算', ' ', '(', ' ', '广义', '积分', '判', '收敛', '、', '定', '积分', '求', '面积', ' ', ')', '\n', '\u3000', '\u3000', '线性代数', '这门', '课', '知识点', '连贯', '(', '所有', '知识点', '都', '是', '围绕', '着', '向量', '的', '相关性', '展开', '的', ')', ',', '概念', '易', '理解', '(', '因为', '这些', '概念', '都', '可以', '通过', '简单', '的', '例子', '进行', '说明', ')', ',', '技巧性', '差', '(', '不管怎么', '出题', ',', '方法', '都', '是', '固定', '的', ')', ',', '题型', '有', '核心', '(', '我们', '可以', '将', '每个', '知识点', '的', '出题', '形式', '进行', '归纳', '总结', ',', '翻来覆去', '就', '这么', '几种', '题型', ')', ',', '所以', '说', '比较', '容易', '得分', '。', '针对', '线性代数', '的', '特点', ',', '我们', '可以', '这样', '准备', '复习', ':', '首先', '要', '将', '线性代数', '的', '知识点', '进行', '条理化', ',', '可以', '参看', '下面', '列', '的', '方框图', '(', '此处', '省略', ')', ':', '\n', '\u3000', '\u3000', '线性代数', '从', '内容', '上', '看', '纵横交错', ',', '前后', '联系', '紧密', ',', '环环相扣', ',', '相互', '渗透', ',', '因此', '解题', '方法', '灵活', '多变', ',', '复习', '时', '应当', '不断', '地', '归纳', '总结', ',', '努力', '搞清', '内在联系', ',', '使', '所学', '知识', '融会贯通', ',', '接口', '与', '切入点', '多', '了', ',', '熟悉', '了', ',', '思路', '自然', '就', '开阔', '了', '。', '例如', ':', '设', ' ', '\n', 'A', ' ', '是', ' ', 'm', '×', 'n', ' ', '矩阵', ',', ' ', 'B', ' ', '是', ' ', 'n', '×', 's', ' ', '矩阵', ',', '且', ' ', 'AB', ' ', '=', ' ', '0', ' ', ',', '那么', '用', '分块', '矩阵', '可知', ' ', 'B', ' ', '的', '列', '向量', '都', '是', '齐次', '方程组', ' ', 'Ax', ' ', '=', ' ', '0', ' ', '\n', '的', '解', ',', '再', '根据', '基础', '解系', '的', '理论', '以及', '矩阵', '的', '秩', '与', '向量', '组秩', '的', '关系', ',', '可以', '有', ' ', 'r', '(', 'B', ')', '≤', 'n', '-', 'r', '(', 'A', ')', ' ', '即', ' ', 'r', '(', 'A', ')', ' ', '+', ' ', 'r', '(', 'B', ')', '≤', 'n', ' ', '进而', '可', '求', '矩阵', ' ', 'A', ' ', '或', ' ', 'B', ' ', '\n', '中', '的', '某些', '参数', '。', '又', '如', ',', '对于', ' ', 'n', ' ', '阶', '行列式', '我们', '知道', ':', '若', '|', ' ', 'A', ' ', '|', '=', ' ', '0', ' ', ',', '则', ' ', 'Ax', ' ', '=', ' ', '0', ' ', '必有', '非零解', ',', '而', ' ', 'Ax', ' ', '=', ' ', 'b', ' ', '没有', '惟一', '解', ' ', '(', ' ', '可能', '有', '无穷', '多解', ',', '也', '可能', '无', '解', ' ', '\n', ')', ' ', ',', '而', '当', '|', ' ', 'A', ' ', '|', ' ', '≠', '0', ' ', '时', ',', '可用', '克莱姆', '法则', '求', ' ', 'Ax', ' ', '=', ' ', 'b', ' ', '的', '惟一', '解', ';', '对于', ' ', 'n', ' ', '个', ' ', 'n', ' ', '维', '向量', ' ', 'α', ' ', '1', ' ', ',', ' ', 'α', '2', ' ', ',', ' ', '…', 'α', 'n', ' ', '可以', '利用', '行列式', ' ', 'A', ' ', '\n', '的', '数值', '是否', '为', '零', '|', ' ', 'A', ' ', '|', '=', '|', ' ', 'α', '1', ' ', 'α', '2', ' ', '…', 'α', 'n', ' ', '|', '来', '判断', '向量', '组', '的', '线性', '相关性', ';', '矩阵', ' ', 'A', ' ', '的', '秩', ' ', 'r', '(', 'A', ')', ' ', '是', '用', ' ', 'A', ' ', '中非', '零子', '式', '的', '最高', '阶数', '来', '定义', '的', ',', '若', ' ', 'r', '(', 'A', ')', ' ', '<', ' ', '\n', 'r', ' ', ',', '则', ' ', 'A', ' ', '中', ' ', 'r', ' ', '阶子式', '全为', ' ', '0', ' ', '\n', '。', '凡此种种', ',', '正是', '因为', '线性代数', '各', '知识点', '之间', '有着', '千丝万缕', '的', '联系', ',', '代数', '题', '的', '综合性', '与', '灵活性', '就', '较大', ',', '大家', '整理', '归纳', '时要', '注重', '串联', '、', '衔接', '与', '转换', '。', '应当', '搞清', '公式', '、', '定理', '成立', '的', '条件', ',', '不能', '张冠李戴', ',', '同时', '还应', '注重', '逻辑性', '以及', '语言', '的', '叙述', '表达', '应', '准确', '、', '简明', '。', ' ', '\n', '最后', '应', '注意', '几个', '概念', '间', '矩阵', '运算', ',', '比如', '矩阵', '的', '逆', '、', '伴随', '、', '转置', '等', ',', '这些', '关系', '一般', '出现', '在', '计算', '矩阵', '方程', '中', '。', '\n', '\u3000', '\u3000', '对于', '概率', '这门', '课', ',', '知识点', '分散', ',', '知识点', '相互间', '联系', '较', '少', ',', '但', '公式', '多', '(', '可以', '说', ',', '概率', '的', '考试', '就是', '公式', '应用', '的', '考试', ')', ',', '所以', '做', '题', '基本', '无', '技巧', ',', '题型', '相对', '稳定', ',', '这部分', '是', '大家', '最', '容易', '稳拿', '分', '的', '。', '对于', '概率', '的', '复习', ',', '首先', '要', '理解', '公式', ',', '知道', '公式', '什么', '时候', '用', ',', '用', '在', '什么', '地方', ',', '怎么', '用', '。', '在', '随机', '事件', '部分', '重点', '掌握', '条件', '概率', '公式', '与', '乘法', '公式', '、', '全概', '与', '贝叶斯', '公式', ',', '尤其', '对于', '完备', '事件', '组', '的', '概念', '一定', '要', '好好', '把握', '。', '概率', '的', '考试', '重点', '在', '随机变量', ',', '这部分', '在', '考分', '中', '占有', '相当', '大', '的', '比重', '。', '在', '随即', '变量', '中', ',', '一定', '要', '对', '随机变量', '的', '独立性', '要', '着重', '关注', ',', '因为', '它', '是', '很多', '公式', '成立', '的', '前提', '基础', ',', '如', ' ', '\n', 'D', '(', 'X', ' ', '+', ' ', 'Y', ')', ' ', '=', ' ', 'DX', '+', 'DY', ' ', ',', ' ', 'E', '(', 'XY', ')', '=', 'EXEY', ' ', '\n', '等', '。', '还有', '一个', '需要', '注意', '的', '是', '随机变量', '的', '分布', '函数', '和', '密度', '函数', ',', '对于', '这', '两个', '函数', '一般', '不会', '出', '概念', '题', ',', '而会出', '问题', '求', '解题', '。', '所以', '大家', '一定', '要', '掌握', '它们', '最', '重要', '的', '性质', ':', '分布', '函数', '最', '重要', '的', '性质', '是', '极限', '性质', ',', '密度', '函数', '最', '重要', '的', '性质', '是', '归', '一', '性质', ',', '利用', '这些', '性质', '可以', '求得', '题干', '中', '的', '参数', '。', '对于', '考纲', '上', '规定', '的', '要', '掌握', '的', ' ', '\n', '6', ' ', '个', '常见', '随机变量', ',', '为', '方便', '记忆', ',', '可', '列表', '记忆', ':', '\n', '\u3000', '\u3000', '{', '图片', '1', '显示', '}', '\n', '\u3000', '\u3000', '总之', ',', '要', '加强', '综合', '解题', '能力', '的', '训练', ',', '力求', '在', '解题', '思路', '上', '有所突破', '。', ' ', 'MBA', ' ', '\n', '试题', '与', '教科书', '上', '的', '习题', '的', '不同点', '在于', ',', '前者', '是', '在', '对', '基本概念', '、', '基本', '定理', '、', '基本', '方法', '充分', '理解', '的', '基础', '上', '的', '综合', '应用', ',', '有', '较大', '的', '灵活性', ',', '往往', '一个', '命题', '覆盖', '多个', '内容', ',', '涉及', '到', '概念', '、', '直观', '背景', '、', '推理', '和', '计算', '。', '许多', '考生', '往往', '难以', '适应', ',', '其', '突出', '感觉', '是', '没有', '思路', ',', '这', '正是', '考生', '考前', '准备', '应', '解决', '的', '突破口', '。', '考虑', '到', '数学', '学科', '的', '特点', ',', '要求', '考生', '自己', '将', '所有', '的', '解题', '思路', '都', '琢磨', '出来', '是', '十分困难', '的', ',', '这方面', '通常', '可以', '通过', '求教', '有', '经验', '的', '老师', ',', '参加', '有', '较', '好', '信誉', '的', '辅导班', ',', '或者', '阅读', '有关', '的', '辅导书', '解决', '。', '必须', '强调', '的', '是', ',', '辅导班', '或', '辅导书', '只是', '学习', '的', '一种', '手段', ',', '最终', '解决问题', '还要', '靠', '自己', '动手', '动脑', '。', '要', '充分利用', '一切', '学习', '机会', ',', '力求', '对', '常见', '的', '考题', '类型', '、', '题型', '、', '思路', '、', '特点', '有', '一个', '系统', '的', '把握', ',', '并', '在', '此基础', '上', '自己', '动手做', '一定', '数量', '的', '综合性', '练习题', ',', '温故而知新', ',', '不断', '提高', '自己', '的', '分析', '解题', '能力', '。', '\n', '\u3000', '\u3000'], 'C000020')
(['\n', '\n', '\n', '夜幕', '下', '的', '太和', '门', '广场', '\n', '\u3000', '\u3000', '9', '月', '18', '日晚', ',', '时值', '中国', '传统', '佳节', '农历', '八月', '十五', '中秋节', '之际', ',', '由', '中国', '故宫博物院', '主办', '、', '山东', '潍柴', '动力', '股份', '有限公司', '冠名', '赞助', '的', '“', '太和', '邀月颂', '和平', '—', '—', '潍柴', '动力', '之夜', '”', '中秋', '招待会', '在', '北京故宫', '太和', '门', '广场', '举行', '。', '来自', '国内', '政府', '、', '文化', '演艺界', '及', '企业界', '等', '各界', '精英', '汇聚', '古老', '神秘', '的', '宫内', '广场', ',', '抒发', '当代', '国人', '对', '历史', '的', '追思', '和', '对', '中华民族', '未来', '的', '憧憬', ',', '举杯', '邀月', '共度', '中秋', ',', '把', '纪念', '故宫博物院', '建院', '80', '周年', '、', '中国', '人民', '抗日战争', '胜利', '60', '周年', '两个', '活动', '再次', '推向', '了', '高潮', '。', '本次', '招待会', '由', '著名', '学者', '田青', '和', '凤凰卫视', '当家花旦', '陈鲁豫', '、', '曹', '景行', '主持', '。', '\n', '\u3000', '\u3000', '是', '日', '晚上', ',', '北京', '太和', '门', '广场', '灯光', '璀璨', ',', '高朋满座', ',', '文化氛围', '浓郁', '。', '来自', '戏曲界', '、', '演奏', '界', '、', '表演', '界', '的', '大师', '们', '给', '与会者', '奉献', '上', '了', '《', '思乡曲', '》', '《', '二泉映月', '》', '《', '八月', '十五', '月', '光明', '》', '等', '著名', '的', '传统', '曲目', ',', '著名', '表演家', '濮存昕', '、', '吴俊全', '等', '还', '朗诵', '了', '《', '水调歌头', '》', '《', '雪落', '在', '中国', '土地', '上', '》', '等', '著名', '古今', '诗歌', ',', '表达', '了', '对', '中华民族', '优秀', '传统', '文化', '的', '追思', '和', '对', '民族', '昌盛', '的', '期盼', '。', '此外', ',', '来自', '书画界', '的', '大师', '们', '还', '现场', '泼墨', ',', '鉴赏', '经典', '古画', ',', '并', '留下', '墨宝', '以作', '纪念', '。', '艺术表演', '家们', '在', '舞台', '上', '精彩', '的', '表现', '赢得', '了', '与会', '各界', '嘉宾', '的', '阵阵', '掌声', ',', '人们', '乘着', '朗朗', '月色', ',', '举杯', '邀月', ',', '畅谈', '古今', ',', '抒发', '着', '当代', '中国', '对', '历史', '的', '铭记', '和', '对', '未来', '民族', '复兴', '的', '祈盼', '。', '\n', '独唱', '《', '今夜', '无人', '入睡', '》', '—', '—', '著名', '男高音', '歌唱家', '莫华伦', '\n', '小提琴', '演奏家', '陈曦', '与', '主持人', '陈鲁豫', '交流', '\n', '\u3000', '\u3000', '今年', '是', '北京故宫博物院', '成立', '八十周年', ',', '八十年', '来', ',', '北京故宫', '为', '弘扬', '中华民族', '的', '传统', '文化', ',', '为', '保护', '我国', '珍贵', '的', '历史', '遗产', '作出', '了', '巨大', '的', '贡献', ';', '同时', ',', '今年', '也', '是', '中国', '人民', '抗日', '胜利', '六十周年', ',', '身处', '北京故宫', '的', '太和', '门', '广场', '正是', '当年', '日寇', '华北', '方面军', '向', '中国', '统辖', '华北地区', '的', '第十一', '战区', '投降', '的', '仪式', '举行', '的', '地方', '。', '可以', '说', ',', '身处', '紫禁城', '的', '太和殿', '见证', '了', '我国', '历史', '的', '兴衰', '荣辱', ',', '见证', '了', '中国', '人民', '抗日战争', '的', '伟大胜利', ';', '六十年', '后', ',', '在', '同一', '地点', '举行', '纪念活动', ',', '意义', '非同小可', '。', '它', '告诉', '我们', '要', '铭记', '历史', ',', '继往开来', ',', '要', '为', '中华民族', '的', '伟大', '复兴', ',', '为', '世界', '各族人民', '的', '和平', '而', '不懈', '奋斗', '!', '\n', '濮存昕', '朗诵', '\n', '\u3000', '\u3000', '据悉', ',', '来自', '潍柴', '动力', '股份', '有限公司', '的', '领导', '介绍', ',', '作为', '国内', '知名', '的', '内燃机', '研发', '、', '制造', '、', '销售', '骨干企业', ',', '潍柴', '动力', '一直', '关注', '首都', '文化产业', '的', '发展', ',', '希望', '凭借', '此次', '活动', ',', '给', '中国', '的', '精英', '人士', '提供', '一个', '更好', '的', '交流', '机会', '和', '场所', ',', '拓展', '企业', '发展', '平台', ',', '振奋', '民族', '精神', ',', '为', '繁荣', '国际', '文化交流', ',', '进一步', '开辟', '中国', '文化', '传承', '空间', '贡献', '更', '多', '的', '力量', '!', '\n', '书法', '表演', '\n', '\u3000', '\u3000', '晚会', '在', '著名', '男高音', '歌唱家', '莫华伦', '的', '一曲', '《', '今夜', '无人', '入眠', '》', '中', '结束', ',', '留给', '了', '节日', '的', '京城', '一个', '难忘', '的', '夜晚', '。', '\n', '\u3000', '\u3000', '搜狗', '(', 'www', '.', 'sogou', '.', 'com', ')', '搜索', ':', '“', '太和', '”', ',', '共', '找到', '322', ',', '079', '\n', '个', '相关', '网页', '.', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00'], 'C000022')
(['&', 'nbsp', ';', '中国', '人', '为啥', '没有', '西方人', '高', '?', ' ', '\n', '\u3000', '\u3000', '饮食', '人类学家', '发现', ',', '旧石器时代', '的', '先祖', '们', '茹毛饮血', ',', '食肉', '和', '生食', ',', '身材', '比', '我们', '高大', '30', '%', '左右', '。', '今天', '的', '西方人', ',', '仍然', '喜欢', '吃', '带', '血丝', '的', '肉', '和', '生菜', '色拉', ',', '身材', '也', '仍旧', '比', '吃', '米面', '和', '爱', '烹调', '的', '亚洲', '人', '“', '大', '一号', '”', '。', '特别', '是', '阿尔卑斯山', '以北', '的', '日耳曼', '民族', ',', '分布', '在', '德国', '、', '荷兰', '和', '北欧', '等', '地', ',', '冬天', '长', ',', '睡眠', '久', ',', '喝', '鲜奶', ',', '食', '生肉', ',', '男人', '平均', '身高', '1.8', '米', '以上', '。', '其中', ',', '荷兰人', '又', '酷爱', '鲜奶', '和', '乳制品', ',', '人均', '身高', '为', '世界之最', '。', ' ', '\n', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '营养学家', '发现', ',', '谷物', '和', '薯类', '含', '凝聚', '素', ',', '影响', '蛋白', '的', '吸收', '和', '多胺', '的', '数量', ',', '会', '使', '生长', '缓慢', ',', '身材矮小', '。', '肉食', '比', '素食', '含有', '更', '丰富', '的', '营养', '和', '性激素', '原料', ',', '生食', '比', '熟食', '含有', '更', '多', '的', '生长激素', '原料', '。', '人', '的', '发育', '在', '12', '岁', '前', '主要', '靠', '生长激素', ',', '12', '~', '25', '岁', '主要', '靠', '性激素', '。', '营养', '和', '激素水平', '可以', '影响', '当代人', '身高', ',', '持续', '到', '四代', '以后', '可以', '显著', '改变', '遗传基因', '。', '\n', '\u3000', '\u3000', '在', '百万年', '漫长', '的', '冬夜', '里', ',', '北欧', '人', '世世代代', '长时间', '睡眠', ',', '分泌', '了', '充足', '的', '生长激素', '。', '同时', '大量', '的', '动物性', '生食', '提供', '了', '丰富', '的', '营养', '和', '性激素', '原料', ',', '这', '使得', '他们', '能够', '昂首', '全人类', '。', '在', '动物性', '食品', '中', ',', '牛奶', '含', '大量', '激素', ',', '它', '可以', '使', '小牛', '在', '数月', '里长', '高', ',', '也', '可以', '帮助', '乳糖酶', '充足', '的', '小孩', '在', '数年', '内长', '高', '。', '喝奶', '最多', '、', '乳糖酶', '充足', '的', '荷兰人', ',', '平均', '身高', '成为', '人类', '的', '“', '珠峰', '”', '。', '\n', '\u3000', '\u3000', '以下', '的', '最佳', '营养', '、', '睡眠', '和', '运动', '方式', ',', '会', '使', '你', '的', '孩子', '长得', '高', ':', '\n', '\u3000', '\u3000', '第一', '、', '最佳', '营养', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '多', '吃', '10', '类食品', ',', '包括', '鱼类', '、', '海鲜', '、', '海藻', '、', '肉类', '、', '蛋类', '、', '菌类', '、', '坚果', '、', '种子', '、', '蔬菜', '、', '水果', ',', '有些', '可生', '吃', ';', '多', '吃', '母乳', ',', '多', '喝', '鲜奶', '(', '如果', '乳糖酶', '充足', ')', ',', '不', '加热', ',', '以', '保证', '营养素', '和', '激素', '原料', '的', '摄入', '。', '\n', '\u3000', '\u3000', '早', '、', '晚是', '喝奶', '的', '最佳时机', ',', '早餐', '时', '喝奶', ',', '给', '一天', '的', '活力', '提供', '充分', '的', '营养', '保证', ';', '晚上', '喝牛奶', ',', '不但', '有助于', '睡眠', ',', '而且', '有助于', '人体', '对', '其', '营养', '成份', '的', '吸收', '。', '最佳', '营养', ' ', '\n', '\n', '\n', '\u3000', '\u3000', '据', '美英', '两', '国', '医学专家', '研究', '发现', ',', '牛奶', '中', '含有', '两种', '过去', '人们', '未知', '的', '催眠', '物质', ',', '其中', '一种', '是', '能够', '促进', '睡眠', '的', '以', '血清素', '合成', '的', '色氨酸', ',', '由于', '它', '的', '作用', ',', '往往', '只', '需要', '一杯', '牛奶', '就', '可以', '使人', '入睡', ';', '另外', '一种', '则', '是', '具有', '类似', '麻醉', '镇静', '作用', '的', '天然', '吗啡', '类', '的', '物质', '。', '所以', ',', '如果', '在', '早晨', '饮奶', ',', '就', '必然', '会', '使', '人', '的', '大脑皮层', '受到', '抑制', ',', '影响', '白天', '的', '工作', '和', '学习', '。', '此外', ',', '早晨', '饮奶', '也', '不利于', '消化', '和', '吸收', ',', '这', '是因为', '牛奶', '的', '蛋白质', '要', '经过', '胃', '和', '小肠', '的', '分解', '形成', '氨基酸', '后', '才能', '被', '人体', '吸收', ',', '而', '早晨', '空腹', '状态', '下', ',', '胃', '、', '肠', '的', '排空', '是', '很快', '的', ',', '因此', '牛奶', '还', '来不及', '消化', '就', '被', '排到', '了', '大肠', '。', '再有', ',', '食物', '当中', '被', '吸收', '的', '蛋白质', '只有', '在', '热量', '充足', '的', '基础', '上', '才能', '构成', '人体', '组织', '的', '一部分', ',', '倘若', '热量', '不足', ',', '吸收', '的', '蛋白质', '就', '很快', '变成', '热量', '而', '被', '消耗掉', '了', ',', '这', '无疑', '是', '一种', '大材小用', '的', '浪费', '。', ' ', '\n', '\u3000', '\u3000', '因此', '营养', '专家', '们', '认为', ',', '牛奶', '最好', '在', '傍晚', '或', '临睡', '之前', '半小时', '饮用', '。', '\u3000', '\u3000', '喝牛奶', '应当', '避', '误区', '\u3000', '\u3000', '牛奶', '含有', '丰富', '的', '营养', ',', '其中', '不但', '包括', '必需', '氨基酸', ',', '还有', '含量', '高且', '易', '吸收', '的', '钙', ',', '长期', '饮用', '对', '身体', '非常', '有', '好处', '。', '不过', ',', '饮用', '牛奶', '一定', '要', '讲究', '方式', ',', '以下', '是', '喝牛奶', '常见', '的', '误区', ',', '你', '一定', '要', '注意', '避免', '—', '—', '—', ' ', '\n', '\u3000', '\u3000', '空腹', '喝牛奶', '\u3000', '\u3000', '空腹', '饮用', '牛奶', '会', '使', '肠蠕动', '增加', ',', '牛奶', '在', '胃', '内', '停留时间', '缩短', ',', '使', '内部', '的', '营养素', '不能', '被', '充分', '吸收', '利用', '。', '喝牛奶', '最好', '与', '一些', '淀粉类', '的', '食物', ',', '如', '馒头', '、', '面包', '、', '玉米粥', '、', '豆类', '等同', '食', ',', '有利于', '消化', '和', '吸收', '。', ' ', '\n', '\u3000', '\u3000', '食物', '搭配', '不当', '\u3000', '\u3000', '牛奶', '不宜', '与', '含', '鞣酸', '的', '食物', '同吃', ',', '如', '浓茶', '、', '柿子', '等', ',', '这些', '食物', '易', '与', '牛奶', '反应', '结块', '成团', ',', '影响', '消化', '。', ' ', '\n', '\u3000', '\u3000', '偏爱', '高度', '加工', '的', '牛奶', '\u3000', '\u3000', '高度', '加工', '后', '的', '牛奶', ',', '其', '营养价值', '不', '一定', '比', '鲜牛奶', '好', '。', '这', '是因为', '经过', '多次', '加工', '后', ',', '牛奶', '中', '大多', '加入', '了', '微量元素', '或', '无机盐', ',', '但', '这些', '成分', '并非', '每个', '人', '都', '需要', '补充', ',', '所以', '也', '就', '不', '一定', '适合', '每', '一个', '人', '。', '\n', '\u3000', '\u3000', '第二', '、', '睡眠', '充足', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '12', '岁', '以下', '睡眠', '8', '小时', '以上', ',', '以', '保证', '生长激素', '的', '分泌', '。', '最佳', '睡眠', ' ', '\n', '\n', '\u3000', '\u3000', '睡眠', '或', '觉醒', '是', '正常', '的', '生理', '过程', ',', '但', '它', '不是', '人为', '能', '完全', '自主', '控制', '的', '活动', ',', '而是', '一个', '被动', '过程', '。', '它', '不', '像', '人体', '某些', '活动', '可', '按', '人', '的', '意志', ',', '说来', '就', '来', ',', '要止', '则', '止', '。', '失眠', '的', '人', '常常', '难以', '诱导', '师', '自己', '进入', '睡眠', '而', '苦恼', '。', '其实', '早期', '的', '轻度', '失眠', ',', '经过', '自我', '调理', '的', '办法', '就常', '可', '得益', ',', '具体', '归纳如下', ':', ' ', '\n', '\u3000', '\u3000', '平常', '而', '自然', '的', '心态', '。', '出现', '失眠', '不必', '过分', '担心', ',', '越是', '紧张', ',', '越是', '强行', '入睡', ',', '结果', '适得其反', '。', '有些', '人', '对', '连续', '多天', '出现', '失眠', '更是', '紧张不安', ',', '认为', '这样', '下去', '大脑', '得不到', '休息', ',', '不是', '短寿', ',', '也', '会', '生病', '。', '这', '类', '担心', '所致', '的', '过分', '焦虑', ',', '对', '睡眠', '本身', '及其', '健康', '的', '危害', '更大', '。', ' ', '\n', '\u3000', '\u3000', '寻求', '并', '消除', '失眠', '的', '原因', '。', '造成', '失眠', '的', '因素', '颇', '多', ',', '前', '已', '提及', ',', '只要', '稍加', '注意', ',', '不难', '发现', '。', '原因', '消除', ',', '失眠', '自愈', ',', '对', '因', '疾病', '引起', '的', '失眠', '症状', ',', '要', '及时', '求医', '。', '不能', '认为', ':', '失眠', '不过', '是', '小', '问题', ',', '算不了', '病而', '延误', '治疗', '。', ' ', '\n', '\u3000', '\u3000', '身心', '松驰', ',', '有益', '睡眠', '。', '睡前', '到', '户外', '散步', '一会儿', ',', '放松', '一下', '精神', ',', '上床', '前', '或', '洗个', '沐浴', ',', '或', '热', '水泡', '脚', ',', '然后', '就寝', ',', '对', '顺利', '入眠', '有百利而无一害', '。', '诱导', '人体', '进入', '睡眠', '状态', ',', '有', '许多', '具体方法', ',', '例如', ':', '放松', '功', ',', '已', '在', '民间', '流传', ',', '可以', '借助', '。', '此外', ',', '再', '介绍', '两种', '简而', '易行', '之', '法', ':', ' ', '\n', '\u3000', '\u3000', '闭目', '入静', '法', '。', '上床', '之后', ',', '先合', '上', '双眼', ',', '然后', '把', '眼睛', '微微', '张开', '一条', '缝', ',', '保持', '与', '外界', '有些', '接触', ',', '虽然', ',', '精神', '活动', '仍', '在', '运作', ',', '然而', ',', '交感神经', '活动', '的', '张力', '已', '大大', '下降', ',', '诱导', '人体', '渐渐', '进入', '睡意', '蒙胧', '状态', '。', ' ', '\n', '\u3000', '\u3000', '鸣天', '鼓法', '。', '上床', '后', ',', '仰卧', '闭目', ',', '左掌', '掩', '左耳', ',', '右掌', '掩', '右耳', ',', '用', '指头', '弹击', '后脑勺', ',', '使', '之', '听到', '呼呼', '的', '响声', '。', '弹击', '的', '次数', '到', '自觉', '微累', '为止', '。', '停止', '弹击', '后', ',', '头', '慢慢', '靠近', '睡', '枕', ',', '两后', '自然', '安放', '于身', '之', '两侧', ',', '便会', '很快', '入睡', '了', '。', ' ', '\n', '\u3000', '\u3000', '睡眠', '诱导', '。', '聆听', '平淡', '而', '有', '节律', '的', '音响', ',', '例如', ':', '火车', '运行', '声', '、', '蟋蟀', '叫', '、', '滴水', '声', '以及', '春雨', '淅沥', '淅沥', '声音', '的', '磁带', ',', '或', '音乐', '催眠', '音带', ',', '有助', '睡眠', ',', '还', '可以', '此', '建立', '诱导', '睡眠', '的', '条件反射', '。', ' ', '\n', '\u3000', '\u3000', '饮热', '牛奶', '法', '。', '睡前', '饮', '一杯', '加糖', '的', '热', '牛奶', ',', '据', '研究', '表明', ',', '能', '增加', '人体', '胰岛素', '的', '分泌', ',', '增加', '氨酸', '进入', '脑细胞', ',', '促使', '人脑', '分泌', '睡眠', '的', '血清素', ';', '同时', '牛奶', '中', '含有', '微量', '吗啡', '样式', '物质', ',', '具有', '镇定', '安神', '作用', ',', '从而', '促使', '人体', '安稳', '入睡', '。', ' ', '\n', '\u3000', '\u3000', '合适', '的', '睡姿', '。', '睡眠', '姿势', '当然', '以', '舒适', '为宜', ',', '且', '可', '因人而异', '。', '但', '睡眠', '以', '侧卧', '为佳', ',', '养生', '家', '曹慈山', '在', '《', '睡诀', '》', '中', '指出', ':', '“', '左侧', '卧屈', '左足', ',', '屈', '左臂', ',', '以', '手上', '承头', ',', '伸右足', ',', '以', '右手', '置于', '右', '股间', '。', '右', '侧卧位', '反', '是', '。', '”', '这种', '睡眠', '姿势', '有利于', '全身', '放松', ',', '睡得', '安稳', '。', ' ', '\n', '\u3000', '\u3000', '若', '疲劳', '而', '难以', '入睡', '者', ',', '不妨', '食用', '苹果', '、', '香蕉', '、', '橘', '、', '橙', '、', '梨', '等', '一类', '水果', '。', '因为', ',', '这', '类', '水果', '的', '芳香', '味', ',', '对', '神经系统', '有', '镇静', '作用', ';', '水果', '中', '的', '糖分', ',', '能', '使', '大脑皮质', '抑制', '而易', '进入', '睡眠', '状态', '。', ' ', '\n', '\u3000', '\u3000', '若因', '出差', '在外', ',', '不', '适应环境', '而致', '失眠', '时', ',', '应先', '有', '思想', '准备', ',', '主动', '调适', ',', '有备无患', ',', '不致', '因', '紧张', '担心', '睡', '不好', '。', '同时', '还', '可', '采用', '以上', '助眠', '之法', ',', '则', '可', '避免', '失眠', '。', '最佳', '运动', ' ', '\n', '\n', '\u3000', '\u3000', '第三', '、', '足量', '运动', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '尽量', '在', '户外', ',', '每天', '运动', '几个', '小时', '以上', ',', '以', '增加', '各种', '营养物质', ',', '包括', '维生素', 'D', '、', '钙', '和', '“', '太阳能', '”', '的', '形成', '和', '吸收', ',', '促进', '骨骼', '和', '肌肉', '的', '快速', '生长', '。', '\n', '\u3000', '\u3000', '身高', '能否', '如意', ',', '取决于', '几个', '因素', ',', '首先', '是', '遗传', '因素', ',', '占', '70', '%', ',', '此外', ',', '取决于', '其他', '条件', ',', '包括', '运动', '、', '营养', '、', '环境', '和', '社会', '因素', '等', '。', '为了', '让', '孩子', '长得', '更', '高', '一点', ',', '家长', '应', '注意', '以下几点', ':', '\u3000', '\u3000', '一', '、', '莫错', '过', '生长', '快速', '期', '\u3000', '\u3000', '在', '儿童', '少年', '青春', '发育', '过程', '中', ',', '何时', '身高', '长得', '最快', '呢', '?', '研究', '证实', ',', '绝大多数', '中国', '汉族', '儿童', '的', '身高', '突增', '高峰', '为', '女童', '12', '岁', '左右', '、', '男童', '14', '岁', '左右', ';', '90', '%', '以上', '女童', '身高', '增长', '最快', '的', '年龄', '在', '11', '~', '13', '岁', '之间', ',', '男童', '为', '13', '~', '15', '岁', '之间', '。', '为了', '让', '孩子', '长得', '高', '一些', ',', '家长', '尤其', '应', '注意', '孩子', '在', '生长', '快速', '期', '的', '营养', '、', '运动', '等', '问题', '。', '}', '&', 'nbsp', ';', '\u3000', '\u3000', '二', '、', '应', '注重', '营养', '补充', '\u3000', '\u3000', '营养', '是', '儿童', '体格', '生长', '的', '关键', '。', '体格', '正常', '生长', '所', '需', '的', '能量', '、', '蛋白质', '和', '氨基酸', ',', '必须', '由', '食物', '供给', ',', '主要', '是', '肉', '、', '蛋', '、', '豆及', '豆类', '食物', '。', '骨', '的', '形成', '还', '需要', '足够', '量', '的', '钙', '、', '磷及', '微量', '的', '锰', '和', '铁', '。', '钙', '的', '摄入', '不足', '及', '维生素', 'D', '缺乏', '时', ',', '会', '造成', '骨', '矿化', '不足', ',', '维生素', 'A', '缺乏', '会', '使', '骨', '变短', '变厚', ',', '维生素', 'C', '缺乏', '会', '使', '骨细胞', '间质', '形成', '缺陷', '而', '变脆', ',', '这些', '都', '会', '影响', '骨', '的', '生长', '。', '&', 'nbsp', ';', '\u3000', '\u3000', '目前', '一般', '家庭', '在', '有', '荤', '有素', '的', '饮食', '中', ',', '营养', '应该', '是', '全面', '及', '足量', '的', ',', '家长', '应该', '注意', '不要', '让', '孩子', '养成', '偏食', '的', '习惯', ',', '更', '不要', '让', '孩子', '过多地', '吃零食', '而', '影响', '重要', '营养物质', '的', '摄入', '。', '\u3000', '\u3000', '三', '、', '莫', '忽视', '运动', '锻炼', '\u3000', '\u3000', '体育运动', '可', '加强', '机体', '新陈代谢', '过程', ',', '加速', '血液循环', ',', '促进', '生长激素', '分泌', ',', '加快', '骨组织', '生长', ',', '有益于', '人', '体长', '高', '。', '以下', '几种', '运动', '对', '增高', '有', '一定', '效果', ',', '不妨一试', '。', '\u3000', '\u3000', '1', '.'], 'C000020')
(['\n', '\u3000', '\u3000', '【', '来源', ':', '你', '来', '我', '网', '】', ' ', '【', '作者', ':', 'kiidy', '】', '\n', '\u3000', '\u3000', '“', '花落', '繁枝', '千万片', ',', '犹自', '多情', ',', '学雪', '随风', '转', '”', ',', '2006', '年', '的', '春天', ',', '这种', '莺', '飞草长', '、', '树绿', '花香', '的', '常景', ',', '在', '我', '眼中', '变得', '特别', '的', '美丽', '。', '一年', '的', '时间', ',', '在', '许多', '人', '的', '生活', '中', '都', '不会', '有', '什么', '特别', '、', '不会', '产生', '多大', '变化', ',', '但', '在', '同样', '的', '时', '空中', ',', '在', '与', '别人', '一样', '的', '收获', '之外', ',', '我', '完成', '了', '考研', '的', '复习', ',', '是', '这种', '成功', '使', '我', '体会', '到', '了', '风景', '与', '心情', '的', '不同', '。', '我', '不是', '聪明人', ',', '也', '不', '太笨', '。', '\n', '\u3000', '\u3000', '做', '每件事', '要', '想成', '的', '都', '挺', '不', '容易', '的', ',', '所以', '我', '干什么', '事情', ',', '只要', '认准', '了', '都', '特', '使劲', '。', '考研', '是', '大事', ',', '从', '一', '开始', '就', '没想', '过', '不考', ',', '原因', '很多', ':', '父母', '的', '期望', ',', '逃避', '工作', '及', '喜欢', '校园生活', '。', '\n', '\u3000', '\u3000', '考研', ',', '真的', '爱', '你', '吗', '?', '\n', '\u3000', '\u3000', '我', '想', '并', '不是', '每个', '同学', '都', '想', '考研', ',', '还有', '许多', '不', '考研', '的', '友', '人们', '对', '我们', '考研', '大军', '不屑一顾', ',', '事实', '是', '考上', '了', '也', '并不一定', '就', '前程似锦', ',', '要', '知道', '两三年', '后', '依然', '是', '面临', '很大', '的', '就业', '压力', ',', '而', '工作', '的', '同学', '已经', '是', '经验丰富', ',', '在职', '场上', '有所作为', '了', '!', '这要', '看', '个人', '的', '追求', '、', '家庭', '经济', '状况', ',', '要', '综合', '来', '衡量', '自己', '是否', '需要', '考研', ',', '是否', '有', '必要', '再', '拼', '一次', '。', '如果', '知道', '了', '自己', '下', '一步', '该', '干什么', ',', '并且', '目标', '明确', ',', '那', '就', '只管', '拼', '了', '。', '早期', '气馁', '的', ',', '中途', '放弃', '的', ',', '上', '了', '考场', '还', '没考', '完', '的', '大有人在', ',', '所以', '下', '了', '决心', '就要', '坚持到底', ',', '俗话说', '“', '坚持到底', '就是', '胜利', '”', '用', '在', '考研', '上', '是', '最', '恰当', '不过', '的', '了', '。', '\n', '\u3000', '\u3000', '跨专业', ',', '做', '我', '想', '做', '的', '\n', '\u3000', '\u3000', '我', '没考', '化学', '类', '的', ',', '而是', '选择', '了', '管理', '类', ',', '原因', '依然', '很多', ',', '主要', '是', '我', '对', '化学', '不来电', ',', '高', '中学', '得', '就', '不好', ',', '大学', '成绩', '也', '不好', ',', '我', '很', '了解', '我', '自己', ',', '考上', '了', '我', '还', '会', '像', '读', '本科', '那样', '痛苦', ',', '混日子', ',', '浪费', '青春', ',', '我', '是', '不会', '在', '这', '一', '领域', '有', '什么', '建树', '的', '。', '活', '了', '这么', '大有', '太多', '的', '迫不得已', ',', '想', '让', '自己', '的', '想法', '和', '意愿', '做', '一次', '主', ',', '于是', '我', '选择', '跨专业', '考研', '。', '大家', '都', '知道', '相对', '来讲', ',', '理', '转文', '易', ',', '文转理', '难', '。', '对于', '理工类', '的', '同学', '来说', ',', '只要', '英语', '比较', '不错', ',', '选择', '文科', '中', '的', '经济', ',', '管理', '类', '的', '考数', '三', '、', '数四', '的', '是', '比较', '有', '优势', '的', ';', '要是', '选择', '心理学', '或是', '法学', '这样', '的', '专业', ',', '就', '要求', '你', '有', '浓厚', '的', '兴趣', '和', '良好', '的', '记忆力', '来', '支撑', ',', '要', '有', '比较', '好', '的', '英语', '基础', ',', '这样', '胜出', '的', '机会', '才', '大', '一些', '。', '\n', '\u3000', '\u3000', '在', '选择', '院校', '方面', '要', '依人', '而定', '了', ',', '跨专业', '的', '同学', '选择', '34', '所', '(', '截至', '笔者', '报名', ',', '全国', '有', '34', '所', '院校', '独立', '招收', '研究生', ',', '划', '分数线', ',', '提前', '复试', ')', '还是', '会', '明智', '一些', ',', '由于', '34', '所', '复试', '比较', '早', ',', '若', '不幸', '被', '刷', '那', '还', '可以', '调剂', ',', '还有', '复试', '的', '机会', '。', '若', '报考', '很强', '学校', '的', '热门', '专业', ',', '风险', '必然', '很大', '。', '我', '经过', '再三', '考虑', '还是', '决定', '考', '旅游', '管理', '专业', '的', '最', '知名', '学校', '之一', '—', '—', '北京第二外国语学院', '(', '中国', '旅游', '学院', ')', ',', '这样', '便', '开始', '了', '我', '快乐', '的', '考研', '日子', '。', '\n', '\u3000', '\u3000', '复习', ',', '持久战', '\n', '\u3000', '\u3000', '当时', '我', '自视', '英语', '还', '行', ',', '数学', '不好', ',', '于是', '上', '了', '两个', '数学', '辅导班', ',', '别的', '班', '没上', '。', '现在', '回头', '看', '我', '有', '许多', '复习', '中', '失误', '的', '地方', ',', '在', '这里', '可以', '说', '一下', ',', '大家', '引以为戒', '。', '我', '是', '题海战术', '型', '选手', ',', '由于', '采纳', '一位', '研友', '的', '建议', ',', '我', '在', '后期', '很少', '做', '模拟题', ',', '只顾', '钻', '历年', '真题', ',', '分析', '出题', '的', '大方向', ',', '而', '去年', '的', '考题', '是', '多', '而', '不难', ',', '要求', '计算能力', '强', ',', '我', '是', '会', '做', '而', '做', '不', '对', ',', '那题', '错', '得', '太', '垃圾', '了', '。', '前期', '的', '努力', '大半', '都', '在', '后期', '折腾', '没', '了', '。', '考完', '后', '有', '许多', '同学', '说', '有', '原题', '啊', ',', '做过', '之类', '的话', ',', '我', '是', '听', '得', '一头雾水', ',', '那题', '我', '可是', '从来', '也', '没见', '过', ',', '还有', ',', '我', '保证', '题', '也', '没见', '过', '我', '。', '数学', '是', '难点', ',', '但', '不是', '不可', '战胜', '的', ',', '我', '总结', ',', '要', '考好', '数学', ',', '基本功', '是', '必不可少', '的', ',', '一味', '钻', '高难度', '的', '题', '是', '得不偿失', '的', '。', '因此', ',', '要', '宏观', '、', '微观', '一起', '抓', ',', '两手', '都', '要', '硬', '!', '\n', '\u3000', '\u3000', '专业课', '我', '是', '下', '了', '很大', '的', '功夫', '的', ',', '书', '看', '了', '十几遍', '吧', ',', '记不清', '了', ',', '还', '做', '了', '读书笔记', ',', '把', '所有', '可能', '考', '的', '全都', '列', '了', '出来', '。', '没', '办法', ',', '谁', '叫', '我', '跨专业', '考', '呢', ',', '于是', '早上', '背', '晚上', '背', ',', '一遍', '一遍', ',', '像', '个', '精神病人', '。', '\n', '\u3000', '\u3000', '英语', '的', '复习', '是', '全程', '的', ',', '每天', '都', '要', '练习', '听力', ',', '背', '背单词', ',', '阅读', '复习资料', '也', '看', '了', '许多', ',', '英语', '关键', '是', '培养', '语感', ',', '黑博士', '的', '120', '篇', ',', '220', '篇', ',', '240', '篇', ',', '我', '连', '着', '都', '做', '完', '了', '。', '历年', '考题', ',', '反反复复', '也', '看', '了', '好多遍', ',', '要', '知道', '我', '所', '报考', '的', '二外', '(', '北京第二外国语学院', ')', '对', '英语', '要求', '可', '都', '不', '低', ',', '对手', '都', '是', '很', '牛', '的', '人', '啊', ',', '英语', '都', '得', '七八', '十分', '。', '现在', '多', '做些', '题', ',', '分析', '几百篇', '阅读', ',', '最起码', '考完', '我', '不', '后悔', '。', '所以', '奉劝', '英语', '过', '了', '六级', '的', '同学', '不要', '大意', '啊', '!', '\n', '\u3000', '\u3000', '坚持', ',', '给', '我', '力量', '\n', '\u3000', '\u3000', '到', '了', '后期', '心里', '想', '的', '就', '这么', '一句', '“', '坚持到底', '就是', '胜利', '”', '。', '那时', '身体', '不是', '很', '疲惫', ',', '但', '心里', '很', '是', '疲惫', '。', '很多', '同志', '到', '后期', '依然', '天天', '坐镇', ',', '但', '究竟', '效率', '如何', ',', '学了', '什么', ',', '也', '只有', '他', '自己', '最', '清楚', '。', '我', '那', '时隔', '一段时间', '就', '放纵', '一下', ',', '打打', '排球', '或是', '和', '研友们', '定期', '侃侃', ',', '总之', '要', '学会', '自我调节', '。', '走出', '考场', '的', '那', '一刹那', '我', '想', '的', '不是', '考得', '怎样', ',', '而是', '以后', '我', '做', '什么', '都', '不怕', '了', '。', '因为', '我', '为了', '自己', '的', '理想', '坚持', '奋斗', '了', '十个月', ',', '那', '可是', '三百多个', '日日夜夜', '啊', ',', '容易', '吗', '我', '!', '\n', '\u3000', '\u3000', '我们', '寝室', '有', '四姐妹', ',', '每天', '相互', '鼓励', ',', '共同', '学习', ',', '有', '哪个', '想', '偷懒', '了', ',', '其他', '三个', '会', '同时', '谴责', '她', '。', '无疑', ',', '这样', '的', '氛围', '是', '考研', '路上', '最', '可贵', '的', ',', '可惜', '的', '是', '最后', '只有', '三', '姐妹', '上', '了', '考场', ',', '还有', '一个月', '就', '考试', '的', '时候', ',', '另', '一个', '美眉', '说', '什么', '也', '不学', '了', ',', '任', '我们', '百般', '劝说', '。', '后来', '我们', '三个', '都', '考上', '了', '(', '她俩', '分别', '被', '北京化工大学', '、', '长春', '理工大学', '录取', '了', ')', ',', '美眉', '把', '肠子', '都悔青', '了', '。', '还是', '那句话', ':', '考研', '路上', '早期', '气馁', '的', ',', '中途', '放弃', '的', ',', '上', '了', '考场', '还', '没考', '完', '的', '大有人在', ',', '所以', '下', '了', '决心', '就要', '坚持到底', '。', '坚持到底', '就是', '胜利', '。', '\n', '\u3000', '\u3000', '调剂', ',', '恨', '你', '然后', '爱', '你', '\n', '\u3000', '\u3000', '成绩', '出来', '了', ',', '335', '分', ',', '差额', '复试', '要排', '在', '48', '名', '左右', ',', '我', '的', '排', '在', '50', '名', '左右', ',', '因为', '我报', '的', '专业', '方向', '太热', '(', '旅游', '企业', '管理', ')', ',', '心想', '是', '没戏', '了', ',', '而且', '二外', '不是', '34', '所', '自主', '招生', '的', '院校', ',', '复试', '比较', '晚', '。', '我', '便', '像', '个', '无头', '苍蝇', '一样', '到处', '搜索', '联系', '调剂', '学校', ',', '很快', '档案', '就', '被', '湘潭', '大学', '调走', '了', '。', '当', '我', '在', '湖南', '复试', '时', ',', '二外', '才', '出', '复试线', ',', '呵呵', '!', '除了', '我报', '的', '方向', '是', '339', '分', '左右', ',', '其他', '的', '方向', '都', '是', '320', '分', '左右', ',', '我', '还', '想', '调剂', '到', '二外', '的', '其他', '方向', ',', '可', '档案', '已经', '调走', '了', ',', '这时', '想', '回', '也', '回不去', '了', '。', '二外', '的', '学长', '和', '我', '说', ':', '“', '你', '丫', '就', '安心', '在', '湖南', '复试', '吧', '!', '其他', '方向', '你', '也', '调', '不了', '啊', '!', '二外', '350', '分', '的', '复试', '都', '不', '一定', '上', '呢', ',', '调剂', '是', '正确', '。', '”', '这样', '也', '给', '我', '了', '很多', '安慰', '。', '幸运', '的', '是', '我', '调剂', '到', '南方', '一所', '比较', '有名', '的', '重点', '大学', ',', '学校', '环境', '很', '好', ',', '让', '我', '欣喜', '。', '更', '幸运', '的', '是', ',', '我', '跟', '了', '一位', '好', '导师', '—', '—', '阎友兵', '教授', ',', '他', '不', '但是', '我', '学术研究', '上', '的', '带头人', ',', '更是', '我', '做人', '处事', '的', '好榜样', '。', '在', '老师', '和', '朋友', '的', '支持', '下', ',', '我', '已经', '下定决心', '考博', ',', '圆', '我', '二外', '的', '梦', '!', '\n', '\u3000', '\u3000', '这', '就是', '我', '的', '考研', '之', '路', ',', '辛酸苦辣', ',', '冷暖自知', '。', '\n', '\u3000', '\u3000'], 'C000020')
(['\u3000', '\u3000', '话题', '多', '、', '题材', '广', '、', '时间', '紧', '、', '要求', '高', '的', '议论文', '写作', '一直', '是', '雅思', '写作', '中', '的', '难点', ',', '思维', '狭窄', '、', '词汇', '不足', '也', '一直', '是', '中国', '考生', '的', '通病', ',', '如何', '在', '议论文', '写作', '中', '拓宽', '思路', '?', '怎样', '背诵', '8000', '个', '雅思', '词汇', '?', '备考', '雅思', '写作', '的', '误区', '和', '应对', '方法', '又', '是', '什么', '?', '上周末', ',', '启德', '教育', '吴建业', '老师', '在', '广州', '图书馆', '给', '广大', '考生', '上', '了', '一堂', '生动', '的', '雅思', '议论文', '写作', '课', '。', '\n', '\u3000', '\u3000', '开拓', '思维', '的', '十大', '原则', '\n', '\u3000', '\u3000', '据统计', ',', '近年来', '雅思', '议论文', '写作', '共有', '265', '个', '话题', ',', '常考', '的', '涉及', '环保', '、', '经济', '、', '社会', '、', '教育', '、', '犯罪', '等', '题材', ',', '十分', '广泛', '。', '鉴于', '很多', '考生', '写作', '时', '感觉', '无话可说', ',', '吴建业', '提醒', '考生', '从', '经济', '、', '时间', '、', '健康', '、', '情感', '、', '教育', '、', '心理', '、', '权利', '、', '文化', '、', '环保', '和', '道德', '十大', '原则', '来', '思考', '话题', '的', '意义', '。', '他', '以养', '狗', '为例', ':', '经济', '上要', '花', '很多', '钱', ';', '情感', '上', '亲近', '狗', '就', '会', '在', '一定', '程度', '上', '疏远', '家人', ';', '遛狗', '、', '给', '狗', '冲凉', '等', '浪费时间', ';', '狗', '传播', '疾病', '会', '影响', '健康', ';', '养狗会', '影响', '学习', ';', '狗', '很', '忠诚', ',', '养狗会', '让', '人', '从', '心理', '上', '疏远', '狡诈', '的', '人类', ';', '侵犯', '邻居', '的', '权利', ';', '狗', '到处', '排泄', '会', '破坏', '环境', '等', '。', '“', '这样', '大家', '碰到', '任何', '一个', '话题', '都', '不用', '心虚', '了', '。', '”', '但是', '他', '同时', '提醒', '广大', '考生', '不必', '面面俱到', ',', '只要', '挑出', '十大', '原则', '中', '的', '两三点', '来', '自圆其说', '就', '绰绰有余', '了', '。', '\n', '\u3000', '\u3000', '记住', '800', '个', '核心', '词汇', '\n', '\u3000', '\u3000', '“', '垃圾', '怎么', '说', '?', '可回收', '垃圾', '?', '可降解', '的', '垃圾', '?', '…', '…', '”', '课堂', '上', ',', '吴建业', '关于', '垃圾', '的', '几个', '提问', '难倒', '了', '很多', '在场', '的', '英语专业', '的', '学生', '。', '吴建业', '老师', '表示', ',', '中国', '学生', '在', '学校', '学习', '的', '词汇', '在', '很多', '场合', '用不上', ',', '比如', '英语专业', '八级', '侧重于', '文学名著', ',', '商务英语', '则', '侧重', '谈判', '、', '商业', '词汇', '。', '雅思', '需要', '8000', '词汇', ',', '但', '相当', '一部分', '考生', '疯狂', '地', '从', 'A', '背到', 'Z', ',', '还', '存在', '想', '说', '却说', '不', '出来', ',', '即使', '说', '得', '出来', '也', '衔接', '不来', '的', '问题', '。', '怎么办', '?', '\n', '\u3000', '\u3000', '“', '分类', '背诵', ',', '联想', '记忆', '。', '”', '吴建业', '告诉', '广大', '考生', ',', '只要', '掌握', '了', '800', '个', '词汇', ',', '就', '可', '轻松', '应对', '雅思', '写作', '。', '“', '当然', '这些', '词汇', '是', '剔除', '了', 'dog', '、', 'pig', '之类', '的', '核心', '词汇', '。', '”', '那', '什么', '词才', '叫', '核心', '词汇', '呢', '?', '吴建业', '举', '了', '一个', '例子', ',', '如由', '奢侈', '→', '贫穷', '→', '救助', '→', '难民', '→', '…', '…', ',', '就', '这样', '把', '相关联', '的', '词汇', '串通', '起来', '背诵', ',', '既', '掌握', '了', '词汇', ',', '而', '这些', '词汇', '往往', '是', '一篇', '文章', '中', '可能', '涉及', '的', '内容', '。', '\n', '\u3000', '\u3000', '写', '个性化', '的', '八股文', '\n', '\u3000', '\u3000', '吴', '老师', '还', '指出', '了', '考生', '的', '备考', '误区', '和', '应对', '方法', '。', '针对', '很多', '人', '希望', '通过', '学习', '外文', '名著', '来', '提高', '写作水平', '的', '想法', ',', '吴', '老师', '认为', '外国名著', '对', '大多数', '中国', '考生', '而言', '是', '可望而不可及', '的', '。', '“', '外国人', '学', '汉语', '要', '学习', '汉语', '说得好', '的', '大山', '和', '大牛', ',', '而', '不', '可能', '让', '他们', '学习', '鲁迅', '先生', '的', '《', '药', '》', '、', '《', '孔乙己', '》', '等', '名篇', '。', '”', '同样', ',', '中国', '考生', '要', '学习', '英语', '学得', '优秀', '的', '中国', '人', ',', '他', '认为', '真正', '优秀', '的', '教材', '其实', '是', '中国', '考生', '的', '优秀', '范文', '。', '\n', '\u3000', '\u3000', '提到', '一些', '辅导', '老师', '教育', '学生', '写作文', '一定', '要', '真情流露', ',', '想到', '什么', '就', '说', '什么', ',', '吴', '老师', '认为', '这', '是', '不', '现实', '的', ',', '因为', '对', '大多数', '中国', '考生', '来说', ',', '做到', '挥洒自如', '、', '下笔', '自若', '、', '真情流露', '很难', '。', '而', '很多', '人', '争相', '背诵', '名师', '的', '范文', '又', '搞', '得', '千人一面', ',', '味同嚼蜡', '。', '鉴于', '此', ',', '他', '认为', '既', '要', '学习', '范文', '的', '格式', ',', '又', '要', '有所', '改装', ',', '加入', '自己', '的', '东西', ',', '凸显', '个性', ',', '“', '写', '个性化', '的', '八股文', '”', '。', '\n', '\u3000', '\u3000', '讲座', '上', ',', '吴', '老师', '还', '提醒', '考生', '写作', '时', '不要', '想着', '标新立异', '、', '旁征博引', ',', '只要', '能够', '自圆其说', ',', '多用', '权威', '、', '翔实', '的', '数据', '事例', '来', '说明', '观点', '就', '好', ',', '否则', '会', '画蛇添足', '。'], 'C000020')
(['\u3000', '\u3000', '1', '.', '考生', '填报', '志愿', '采取', '网上', '填报', '方式', ',', '考生', '须', '在', '规定', '时间', '内', '登录', '北京', '教育', '考试院', '网站', '填报', '志愿', ',', '网址', '为', 'www', '.', 'jeea', '.', 'cn', '/', ' ', '或', 'gk', '.', 'bbn', '.', 'com', '.', 'cn', '/', ' ', '。', '同时', '提供', '电话', '填报', '方式', ',', '考生', '可', '通过', '拨打', '声讯', '电话', '1606790', '填报', '志愿', '或', '查询', '志愿', '。', '\n', '\u3000', '\u3000', '2', '.', '考生', '填报', '志愿', ',', '要', '严格', '按照', '《', '2006', '年', '全国', '普通', '高等学校', '在', '京', '招生', '专业', '目录', '》', '填写', '信息', '。', '\n', '\u3000', '\u3000', '3', '.', '考生', '填报', '志愿', '时', ',', '宜先', '草拟', '一份', '志愿', '表', ',', '内容', '包括', '考生', '的', '考生', '号', '和', '要', '填报', '的', '院校', '代码', '及', '名称', '、', '专业', '代码', '及', '名称', ',', '以', '保证', '填报', '志愿', '的', '准确', '和', '填报', '过程', '的', '顺利', '。', '\n', '\u3000', '\u3000', '4', '.', '考生', '在', '网上', '报名', '阶段', '设定', '的', '密码', '作为', '网上', '填报', '志愿', '的', '初始密码', '。', '在', '第一次', '填报', '志愿', '之前', '将', '开通', '系统', '供', '考生', '修改', '密码', ',', '考生', '必须', '修改', '密码', '才能', '进行', '志愿', '填报', ',', '考生', '需', '牢记', '修改', '后', '的', '密码', ',', '凭此', '密码', '进行', '第一次', '志愿', '填报', '、', '第二次', '志愿', '填报', '和', '各', '批次', '志愿', '补报', '。', '如', '考生', '忘记', '密码', ',', '须', '在', '系统', '开通', '的', '日期', '内', '携带', '本人', '身份证', '到', '本报', '名', '单位', '登记', '申请', '恢复', '密码', '。', '\n', '\u3000', '\u3000', '5', '.', '在', '第一次', '志愿', '填报', '时', '同时', '采集', '考生', '特征', ',', '考生', '特征', '的', '主要', '内容', '为', '照顾', '对象', ',', '具备', '相关', '特征', '的', '考生', '须', '参加', '第一次', '填报', '。', '考生', '在', '选中', '相应', '选项', '后', '必须', '向', '报名', '单位', '提供', '相关', '证明', '材料', '方', '为', '有效', '。', '\n', '\u3000', '\u3000', '6', '.', '第一次', '填报', '提前', '批', '、', '本科', '一批', '、', '本科', '二批', '、', '本科', '三批', '的', '志愿', '及', '艺术类', '高职', '录取', '院校', '的', '志愿', ',', '提前', '录取', '院校', '可选报', '两个', '志愿', '学校', ',', '第一批', '、', '第二批', '、', '第三批', '录取', '院校', '可', '在', '本', '批内', '各选报', '三个', '志愿', '学校', ',', '艺术类', '高职', '可选报', '两个', '志愿', '学校', ',', '每个', '志愿', '学校', '可选报', '五个', '专业', '。', '\n', '\u3000', '\u3000', '7', '.', '第二次', '填报', '专科', '录取', '批次', '的', '志愿', ',', '可选报', '四个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '五个', '专业', '。', '\n', '\u3000', '\u3000', '8', '.', '今年', '继续', '实行', '公布', '批次', '未', '完成', '计划', '重新', '征集', '志愿', '再行', '录取', '的', '方式', '。', '在', '本科', '一批', '、', '本科', '二批', '、', '本科', '三批', '和', '专科', '批次', '的', '正式', '志愿', '录取', '结束', '后', ',', '如', '高等学校', '计划', '未', '完成', ',', '将', '公布', '未', '完成', '计划', ',', '重新', '征集', '考生', '志愿', '再行', '录取', '。', '\n', '\u3000', '\u3000', '在', '每个', '批次', '的', '志愿', '补报', '期间', ',', '达到', '相应', '批次', '录取', '控制', '分数线', '且', '未', '被', '录取', '的', '考生', '可', '补报', '相应', '批次', '未', '完成', '招生', '计划', '的', '院校', '和', '专业', '志愿', '。', '录取', '期间', '各', '批次', '未', '完成', '计划', '的', '院校', '和', '专业', '信息', '请', '参照', '北京', '教育', '考试院', '网站', '或', '媒体', '宣传', '。', '\n', '\u3000', '\u3000', '本科', '各', '批次', '补报', '志愿', '可选报', '三个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '三个', '专业', '。', '专科', '批次', '补报', '志愿', '可选报', '四个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '三个', '专业', '。', '\n', '\u3000', '\u3000', '补报', '志愿', '在', '录取', '时', '按照', '“', '分数', '优先', ',', '从', '高分', '到', '低分', ',', '按', '志愿', '顺序', '”', '一次性', '向', '招生', '学校', '投档', ',', '由', '招生', '学校', '审查', '录取', '。', '\n', '\u3000', '\u3000', '9', '.', '电话', '填报', '必须', '使用', '北京市', '固定', '电话', '操作', ',', '且', '务必', '使用', '音频', '电话', '。', '\n', '\u3000', '\u3000', '10', '.', '志愿', '填报', '日程安排', '\n', '\u3000', '\u3000', '5', '月', ' ', '9', '日', ' ', '8', ':', '00', '—', '5', '月', '12', '日', ' ', '8', ':', '00', '\n', '\u3000', '\u3000', '系统', '开通', '供', '考生', '修改', '密码', '\n', '\u3000', '\u3000', '5', '月', '12', '日', '8', ':', '00', '—', '5', '月', '17', '日', '18', ':', '00', '\n', '\u3000', '\u3000', '第一次', '志愿', '填报', '\n', '\u3000', '\u3000', '7', '月', '31', '日', '8', ':', '00', '—', '8', '月', ' ', '2', '日', '18', ':', '00', '\n', '\u3000', '\u3000', '第二次', '志愿', '填报', '\n', '\u3000', '\u3000', '预计', '7', '月', '14', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '一批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '7', '月', '21', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '二批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '7', '月', '27', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '三批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '8', '月', ' ', '7', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '专科', '批次', '志愿', '补报', '\n', '\u3000', '\u3000', '网上', '填报', '志愿', '步骤', '\n', '\u3000', '\u3000', '通过', '浏览器', '登录', 'www', '.', 'bjeea', '.', 'cn', '/', ' ', ',', '点击', '“', '网上', '报名', '”', ',', '然后', '点击', '“', '2006', '年', '北京市', '普通', '高等学校', '招生', '网上', '志愿', '填报', '”', '进入', '系统', ',', '或者', '直接', '登录', 'gk', '.', 'bbn', '.', 'com', '.', 'cn', '/', ' ', '进入', '系统', ';', '\n', '\u3000', '\u3000', '点击', '“', '修改', '密码', '”', '修改', '自己', '的', '密码', ';', '\n', '\u3000', '\u3000', '点击', '“', '提交', '志愿', '信息', '”', ',', '输入', '考生', '号', '、', '密码', '和', '校验码', ',', '点击', '“', '确定', '”', '进行', '登录', '进入', '志愿', '填报', '页', ';', '\n', '\u3000', '\u3000', '有关', '考生', '填报', '考生', '特征', ';', '\n', '\u3000', '\u3000', '填报', '院校', '志愿', '和', '专业', '志愿', ',', '在', '院校', '框中', '输入', '3', '位', '院校', '代码', ',', '在', '专业', '框中', '输入', '2', '位', '专业', '代码', '(', '输入', '代码', '后', '会', '显示', '相应', '院校', '名称', '和', '专业', '名称', ')', ',', '并', '选报', '是否', '服从', '专业', '调剂', '和', '是否', '愿意', '走读', ';', '\n', '\u3000', '\u3000', '点击', '“', '提交', '”', '完成', '志愿', '填报', '。', '\n', '\u3000', '\u3000', '声讯', '电话', '填报', '流程', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '编辑', ':', '苏琳'], 'C000010')
(['\n', '\u3000', '\u3000', '如果', '你', '周围', '的', '不少', '人', '都', '晋升', '了', ',', '那', '就', '该', '好好', '反省', '自己', '了', '。', '看看', '以下', '种种', '晋升', '“', '绝症', '”', ',', '是否', '有', '自己', '的', '身影', '呢', '?', '\n', '\u3000', '\u3000', '职位', '成功', '晋级', ',', '事业', '更上层楼', ',', '这是', '不少', '经理人', '的', '职业', '目标', '。', '然而', ',', '很多', '经理人', '努力', '打拼', '却', '依旧', '还', '在', '原地', '徘徊', '。', '\n', '\u3000', '\u3000', '在', '竞争', '社会', ',', '当', '你', '不能', '升职', '的', '时候', ',', '要', '先', '考虑', '是', '企业', '体制', '的', '问题', ',', '还是', '你', '自己', '的', '问题', '。', '如果', '是', '体制', '问题', ',', '你', '可能', '根本', '就', '没有', '机会', ',', '完全', '可以', '选择', '主动', '离开', '。', '如果', '你', '周围', '的', '不少', '人', '都', '晋升', '了', ',', '那', '就', '该', '好好', '反省', '自己', '了', '。', '看看', '以下', '种种', '晋升', '“', '绝症', '”', ',', '是否', '有', '自己', '的', '身影', '呢', '?', '\n', '\u3000', '\u3000', '失语症', '—', '—', '上司', '换', '了', '8', '个', ',', '我', '还是', '当', '绿叶', '\n', '\u3000', '\u3000', '邓珉', '在', '一家', '知名', '房地产', '物业公司', '做', '行政', '人事主管', ',', '从', '2001', '年', '到', '现在', ',', '公司', '先后', '换', '了', '两任', '老总', ',', '换', '了', '8', '个', '项目经理', ',', '每个', '项目经理', '升职', '调走', '了', ',', '而', '她', '却', '一直', '在', '原地不动', '。', '让', '邓珉', '困惑', '的', '是', ',', '她', '要', '不停', '地', '适应', '新', '领导', '的', '管理', '风格', ',', '而且', '自己', '的', '发展', '空间', '有限', '。', '物业公司', '的', '行政', '人事工作', '并', '不', '复杂', ',', '她', '只要', '用', '30', '%', '的', '精力', '就', '足够', '应付', '得', '了', '。', '公司', '也', '一直', '认为', '邓珉', '是', '个', '老同志', ',', '比较稳定', '塌实', ',', '哪里', '需要', '就让', '邓珉', '过去', '。', '\n', '\u3000', '\u3000', '“', '失语', '”', '诊断', ':', '邓珉', '一直', '在', '做', '默默无闻', '的', '“', '失语', '”', '绿叶', ',', '整整', '陪衬', '了', '8', '位', '上司', '。', '行政', '支持', '工作', '并', '不是', '最', '“', '抢眼', '”', '的', '红花', ',', '企业', '很', '容易', '把', '你', '定性', '。', '虽然', '你', '在', '公司', '给', '大家', '留下', '了', '不错', '的', '印象', ',', '但', '企业', '往往', '是', '哪里', '需要', '你', ',', '就', '把', '你', '往', '哪里', '搬', '。', '\n', '\u3000', '\u3000', '药方', ':', '生意', '就是', '生意', ',', '经理人', '要', '更', '多', '地', '考虑', '自身', '的', '利益', ',', '衡量', '自己', '的', '投入', '和', '产出', ',', '千万别', '做', '赔本', '的', '买卖', '。', '想要', '晋升', ',', '就要', '勇于', '表现', '出来', ',', '要', '捅破', '这层', '窗户纸', '。', '第一', ',', '想要', '。', '第二', ',', '要', '做', '。', '第三', ',', '要', '让', '老板', '知道', '。', '一定', '要', '向', '老板', '提出', '你', '的', '想法', ',', '你', '可以', '结合', '企业', '的', '资源', '和', '现状', '来', '分析', ',', '要', '让', '老板', '意识', '到', ',', '你', '的确', '想要', '承担', '更大', '的', '责任', '。', '另外', ',', '表明', '你', '现有', '工作', '做', '得', '不错', ',', '你', '也', '有', '这样', '的', '能力', '。', '在', '企业', '环境', '相对', '稳定', '时', ',', '企业', '在', '重用', '一个', '人', '的', '时候', ',', '看重', '的', '不是', '能力', ',', '而是', '信任', '。', '这方面', '你', '有', '优势', '。', '\n', '\u3000', '\u3000', '自闭症', '—', '—', '就', '盯', '着', '自己', '的', '一亩', '三分', '地', '\n', '\u3000', '\u3000', '一年', '前', ',', '业绩', '出色', '的', '路平', '被', '破格', '提升', '为', '企划', '经理', ',', '但', '他', '还是', '走', '业务', '路线', ',', '手底下', '没兵', ',', '只有', '一个', '助理', '协助', '他', '。', '他', '一直', '对', '市场', '企划', '总监', '这个', '职位', '心仪已久', ',', '没想到', '最后', '却', '被', '能力', '、', '业绩', '远不如', '自己', '的', '同事', 'PK', '下来', '。', '\n', '\u3000', '\u3000', '原来', ',', '一向', '喜欢', '单打独斗', '的', '路平', '总是', '有点', '各色', ',', '他', '只', '愿意', '盯准', '自己', '那', '一亩', '三分', '地', '。', '例会', '时', ',', '部门', '讨论', '其他', '市场', '活动', '方案', ',', '他', '总是', '一言不发', '。', '等到', '询问', '起', '他', '的', '意见', '时', ',', '他', '便', '说', ',', '“', '不好意思', ',', '我', '没', '来得及', '看', '。', '”', '平日', '的', '团队', '活动', '或是', '聚会', ',', '也', '难见', '他', '的', '身影', '。', '老板', '用人', '所长', ',', '结果', '导向', ',', '对路平', '也', '是', '睁一只眼', '闭一只眼', '。', '但', '同事', '们', '不免', '背后', '嘀咕', ',', '说路平', '小农意识', '。', '\n', '\u3000', '\u3000', '“', '自闭', '”', '诊断', ':', '各色', '的', '路平', '眼里', '只有', '自己', '那', '一摊', '。', '在', '结果', '导向', '、', '业绩', '为', '王', '的', '公司', ',', '这样', '也许', '没错', '。', '但', '在', '晋升', '路上', ',', '过分', '的', '“', '自闭', '”', '会', '让', '上司', '有所', '顾虑', ',', '同事', '的', '反作用力', '也', '会', '断送', '你', '的', '晋升', '良机', '。', '\n', '\u3000', '\u3000', '药方', ':', '职场', '中', '人人', '都', '是', '生意', '伙伴', ',', '上司', '、', '同事', '都', '是', '价值链', '上', '的', '客户', '和', '资源', '。', '只', '盘算着', '自己', '的', '眼前利益', ',', '往往', '会', '失去', '更', '多', '“', '商机', '”', '。', '路平要', '积极', '和', '同事', '们', '主动', '交往', ',', '能者多劳', ',', '既然', '你', '点子', '多', ',', '不妨', '多', '给', '同事', '们', '出', '一些', '好', '创意', ',', '而', '你', '在', '支持', '同事', '的', '同时', ',', '不仅', '获得', '了', '一个', '好', '人缘', ',', '进而', '也', '熟悉', '其他', '业务', '线', ',', '增强', '了', '自身', '的', '实力', '。', '如果', '其他', '业务', '线', '你', '也', '能', '轻松', '玩转', '的话', ',', '上司', '一定', '会', '给', '你', '更', '多', '机会', '的', '。', '\n', '\u3000', '\u3000', '狂妄', '症', '—', '—', '“', '我', '就', '愿意', '让', '别人', '听', '我', '的', '”', '\n', '\u3000', '\u3000', '安妮', '是', '一家', '呼叫', '中心', '项目部', '的', '客服', '经理', ',', '她', '刚', '上任', '不久', ',', '就', '引起', '了', '下属', '的', '极度', '不满', ',', '而且', '被', '投诉', '到', '公司总部', '。', '\n', '\u3000', '\u3000', '原来', ',', '安妮', '个性', '强势', ',', '上任', '后', '就', '进行', '了', '一系列', '改革', ',', '重新', '排班', ',', '规范', '服务', ',', '整顿', '流程', '等等', '。', '改革', '取得', '了', '一定', '成效', ',', '以前', '忙乱', '的', '客服', '工作', '逐渐', '变得', '有序', ',', '但', '安妮', '自己', '却', '引起', '了', '一片', '倒伐之声', '。', '当下', '属', '在', '外面', '忙', '得', '团团转', '时', ',', '她', '却', '在', '自己', '的', '单间', '里', '会客', '聊天', ',', '而且', '经常', '不', '来', '上班', '。', '而', '自由散漫', '的', '安妮', '对', '下属', '却是', '实施', '高压手段', ',', '用', '她', '的话', '来说', ',', '“', '我', '就', '愿意', '管', '人', ',', '让', '别人', '听', '我', '的', '。', '”', '她', '安排', '自己', '的', '亲信', '任职', ',', '监视', '其他', '下属', '言行', ',', '搞', '得', '员工', '怨声载道', '。', '几个', '月', '后', ',', '项目', '高管', '调整', ',', '其他', '几个', '项目', '的', '中层', '都', '获得', '了', '提升', ',', '惟独', '安妮', '没有', '新', '的', '发展', '空间', ',', '最终', '辞职', '而', '去', '。', '\n', '\u3000', '\u3000', '“', '狂妄', '”', '诊断', ':', '安妮', '有着', '强烈', '的', '领导', '欲望', ',', '管理', '风格', '泼辣', '强悍', ',', '但', '她', '却', '忽略', '了', '接受方', '的', '感受', '。', '改革', '虽然', '初见成效', ',', '但', '她', '自己', '却', '难', '为', '表率', ',', '严人', '宽己', '的', '领导', '风格', '必然', '难以', '服众', '。', '\n', '\u3000', '\u3000', '药方', ':', '狂妄', '的', '强权', '不是', '万灵药', ',', '身为', '管理者', ',', '安妮', '既', '是', '规则', '的', '制定者', ',', '也', '是', '规则', '的', '裁判', ',', '如果', '自己', '都', '处处', '破坏', '规则', ',', '一时', '的', '业绩', '也', '只能', '是', '短期', '效应', '。', '而', '下属', '员工', '是', '经理', '的', '供应商', ',', '水能载舟', ',', '也', '能', '覆舟', ',', '业绩', '是', '需要', '大家', '一起', '努力', '做', '出来', '的', '。', '安妮', '如果', '早些', '努力', '调试', '自己', ',', '采取', '一些', '柔性', '管理手段', ',', '避免', '激进', '改革', ',', '以身作则', '让', '员工', '口服心服', ',', '也', '不至于', '在', '项目', '调整', '时', '弄', '得', '丢盔卸甲', '。', '\n', '\u3000', '\u3000', '多动症', '—', '—', '不', '开心', '就', '跳', ',', '越', '跳越', '迷茫', '\n', '\u3000', '\u3000', '30', '出头', '的', '汪力', '已经', '换', '了', '6', '家', '企业', ',', '现在', '一家', 'IT', '企业', '任', '数码产品', '经理', '。', '年轻', '时', '为了', '薪水', '而', '跳', ',', '把', '跳槽', '当成', '涨薪', '的', '跳板', ',', '往往', '是', '这家', '企业', '还', '没', '彻底', '了', '断', ',', '就', '已经', '在', '下家', '开始', '领', '薪水', '。', '近一年来', ',', '汪力', '倒', '还', '算', '得', '上', '稳定', ',', '一直', '没什么', '非分之想', '。', '但', '上个月', ',', '公司', '的', '产品', '总监', '换成', '了', '一个', '台湾', '老板', ',', '对', '汪力', '似乎', '有些', '看不顺眼', ',', '重要', '业务', '会议', '不让', '他', '参加', ',', '一些', '产品', '的', '推广', '预算', '也', '卡得', '很', '紧', '。', '汪力', '感觉', '自己', '不', '被', '信任', ',', '正', '逐渐', '被', '边缘化', ',', '他', '又', '动', '了', '大不了', '走人', '的', '念头', '。', '\n', '\u3000', '\u3000', '汪力', '把', '自己', '的', '简历', '给', '了', '一家', '猎头', ',', '没想到', '猎头', '却', '称', ',', '他', '跳槽', '频率', '过快', ',', '如果', '要', '晋升', '高职', ',', '希望', '并不大', '。', '如果', '平级', '跳', ',', '汪力', '又', '不', '甘心', '。', '\n', '\u3000', '\u3000', '“', '多动', '”', '诊断', ':', '通常', ',', '猎头', '非常', '不', '喜欢', '频繁', '跳槽', '的', '人', ',', '因为', '频繁', '跳槽', '说明', '此人', '目标', '不', '清晰', ',', '对', '公司', '的', '忠诚度', '值得', '怀疑', '。', '汪力', '一直', '对', '自己', '期望', '较', '高', ',', '如果', '现实', '稍', '不如意', ',', '便', '有', '“', '弃暗投明', '”', '的', '念头', '。', '但', '频频', '转换', ',', '跳成', '了', '习惯', ',', '在', '每', '一个', '职位', '上', '都', '不能', '积累', '较', '多', '的', '资本', ',', '更', '谈不上', '为', '晋升', '打下', '坚实', '根基', '了', '。', '\n', '\u3000', '\u3000', '药方', ':', '在', '猎头', '眼中', ',', '在', '一家', '公司', '中高层', '职位', '上', '干满', '3', '年', '的', '候选人', '是', '比较', '理想', '的', '。', '汪力', '如果', '认准', '了', '行业', ',', '就要', '努力', '埋头', '做', '下去', ',', '没有', '完美', '的', '企业', '和', '上司', ',', '你', '在', '这家', '企业', '被', '边缘化', ',', '如果', '不能', '咸鱼', '翻生', '的话', ',', '再换', '一家', '也', '同样', '如此', '。', '只有', '想', '清楚', '自己', '的', '目标', ',', '稳扎稳打', ',', '步步为营', ',', '用', '实在', '的', '业绩', '说话', ',', '下', '一个', '晋升', '机会', '才', '不会', '擦肩而过', '。', '\n', '\u3000', '\u3000', '其他', '非典型', '晋升', '“', '绝症', '”', '\n', '\u3000', '\u3000', '1', '.', '“', '红眼病', '”', ',', '容不得', '他人', '比', '自己', '能干', ',', '喜欢', '背后', '冷嘲热讽', '。', '\n', '\u3000', '\u3000', '2', '.', '“', '营养不良', '”', ',', '知识', '和', '能力', '总是', '跟不上', '企业', '步伐', '。', '\n', '\u3000', '\u3000', '3', '.', '“', '骨质', '疏松', '”', ',', '没有', '主见', ',', '人云亦云', ',', '就', '会', '做', '老好人', '。', '\n', '\u3000', '\u3000', '…', '…', '\n', '\u3000', '\u3000', '第', 'N', '种', ':', '“', '抑郁症', '”', ',', '非黑', '即', '白', ',', '抱怨', '连连', '却', '缺乏', '行动', '力', '。', '\n', '\u3000', '\u3000', '(', '文章', '出自', ':', '前程无忧', '〈', '人力资本', '〉', '杂志', ')'], 'C000014')
(['\u3000', '\u3000', '9', '日', '在京举行', '的', '世界卫生组织', '慢性病', '全球', '报告', '中文版', '首发式', '上', ',', '卫生部', '公布', '了', '中国', '慢性病', '情况', '。', '其中', '一个', '令人瞠目', '的', '数字', '是', ',', '目前', '全国', '约', '有', '3', '.', '5', '亿', '吸烟者', ',', '2000', '年', '由', '吸烟', '导致', '的', '死亡', '人数', '近', '100', '万人', ',', '超过', '艾滋病', '、', '结核', '、', '交通事故', '以及', '自杀', '死亡', '人数', '的', '总和', ',', '占', '全部', '死亡', '人数', '的', '12', '%', '。', '\n', '\u3000', '\u3000', '卫生部', '警告', '说', ',', '如', '不', '采取', '控制措施', ',', '预计', '到', '2020', '年时', '这个', '比例', '将', '上升', '至', '33', '%', ',', '死亡', '人数', '将', '达到', '200', '万人', ',', '其中', '有', '一半', '人', '将', '在', '35', '-', '64', '岁', '之间', '死亡', '。', '\n', '\u3000', '\u3000', '2002', '年', '我国', '男性', '吸烟率', '为', '66', '.', '0', '%', ',', '女性', '吸烟率', '为', '3', '.', '08', '%', ',', '与', '1996', '年', '比', ',', '尽管', '吸烟率', '略有', '下降', ',', '随着', '总人口', '的', '增加', ',', '吸烟', '人数', '仍然', '增加', '了', '3000', '万人', '。', '\n', '\u3000', '\u3000', '吸烟', '对', '青年', '十分', '有害', ',', '因此', ',', '应', '尽早', '戒烟', '。', '戒烟', '方法', '很多', ',', '下面', '十二种', '戒烟法', ',', '可', '供', '少年', '吸烟者', '试一试', ':', '\u3000', '\u3000', '(', '1', ')', '特意', '在', '一二天', '内', '超量', '吸烟', '(', '每天', '吸', '两包', '左右', ')', ',', '使', '人体', '对', '香烟', '的', '味道', '产生', '反感', ',', '从而', '戒烟', ';', '或', '在', '患', '伤风感冒', '没有', '吸烟', '欲望', '时', '戒烟', '。', '\u3000', '\u3000', '(', '2', ')', '想象', '自己', '在', '吸烟', ',', '同时', '想象', '令人作呕', '的', '事情', '(', '比如', '你', '手中', '烟盒', '或', '香烟', '上', '有', '痰', '渍', '等等', ')', '。', '\u3000', '\u3000', '(', '3', ')', '将', '戒烟', '的', '原因', '写', '在', '纸', '上', ',', '经常', '阅读', ';', '如能', '可能', ',', '尽量', '补充', '新', '内容', '。', '\u3000', '\u3000', '(', '4', ')', '将', '想', '购买', '的', '物品', '写', '下来', ',', '按', '其', '价格', '计算', '可', '购买', '香烟', '的', '包数', '。', '逐日', '将', '用来', '购买', '香烟', '的', '钱', '储存', '在', '“', '聚宝盆', '”', '内', '。', '每', '过', '一个月', ',', '清点', '一次', '钱数', '。', '\u3000', '\u3000', '(', '5', ')', '同', '朋友', '打', '“', '赌', '”', ',', '保证', '戒烟', '。', '当然', '这要', '用', '自己', '的', '烟', '钱', '作为', ' ', '“', '赌注', '”', '。', '\u3000', '\u3000', '(', '6', ')', '不', '整条', '买烟', '。', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '相关', '事件', ':', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '卫生部', ':', '我国', '青少年', '吸烟', '人数', '高达', '5000', '万', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '9', '日', '在京举行', '的', '世界卫生组织', '慢性病', '全球', '报告', '中文版', '首发式', '上', ',', '卫生部', '公布', '的', '中国', '慢性病', '情况', '表明', ',', '目前', '中国', '青少年', '吸烟', '人数', '高达', '5000', '万人', '。', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '与', '潜意识', '对话', ' ', '临床', '催眠', '治疗', '能', '帮助', '戒烟', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '美国', '科学家', '最近', '经', '研究', '发现', ',', '在', '正规', '的', '临床', '催眠', '师', '帮助', '下', '接受', '催眠', '治疗', ',', '有', '可能', '帮助', '吸烟者', '成功', '戒烟', '且', '长时间', '保持', '戒烟', '状态', '。', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '生活习惯', '影响', '烟瘾', ' ', '晚睡', '早起', '的', '人', '烟瘾', '更大', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '据', '最新', '一期', '《', '国际', '生物钟', '学', '》', '期刊', '研究', '显示', ',', '德国', '科学家', '发现', ',', '早晨', '起床', '时间', '在', '5', '点', '之前', '、', '晚上', '11', '点', '之后', '睡觉', '的', '人', '更', '容易', '吸烟', '!', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文'], 'C000013')
(['\n', '【', '半生', '缘', '】', ' ', '1997', '年', '香港', '东方', '影业公司', '出品', '\n', '半生', '缘', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '他', '一旦', '想起', '曼桢', ',', '就', '觉得', '他', '从来', '也', '没有', '停止', '想念', '她', '过', '。', '就是', '自己', '以为', '已经', '忘记', '她', '的', '时候', ',', '她', '也', '还是', '在', '那里', '的', ',', '在', '他', '一切', '思想', '的', '背后', '。', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '\n', '原著', ':', '张爱玲', '编剧', ':', '陈健忠', '色彩', ':', '彩色片', '长', ':', '125min', '语言', ':', '普通话', '外文', '别名', ':', 'Eighteen', ' ', 'Springs', '(', '1997', ')', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', 'Half', ' ', 'Life', ' ', 'Fate', '(', '1997', ')', '导演', ':', '许鞍华', '主演', ':', '吴倩莲', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '顾曼桢', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '黎', '&', 'nbsp', ';', ' ', '明', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '沈世均', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '黄', '&', 'nbsp', ';', ' ', '磊', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '许叔惠', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '吴辰君', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '石翠芝', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '梅艳芳', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '顾曼璐', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '葛', '&', 'nbsp', ';', ' ', '优', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '祝鸿才', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '王志文', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '张豫槿', '获奖', ':', '1998', '年', '香港', '电影协会', '最佳', '女', '主角奖', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '1998', '年', '香港电影', '金像', '最佳', '女', '配角奖', '\n', '【', '剧情简介', '】', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '30', '年代', '的', '上海', '。', '世钧', '和曼桢', '是', '同一', '工厂', '做工', '的', '恋人', '。', '曼桢', '早年', '丧父', ',', '家庭', '生活', '靠', '姐姐', '曼璐', '当', '舞女', '维持', ',', '后来', '曼璐', '又', '当', '了', '妓女', ',', '最终', '嫁给', '了', '有妇之夫', '祝鸿才', '。', '为了', '保全', '自已', '的', '地位', ',', '不能', '生育', '的', '曼璐以', '一种', '怨毒', '的', '心态', '与其', '夫', '合谋', ',', '令祝', '强奸', '了', '曼桢', '。', '曼桢', '为', '姐姐', '、', '姐夫', '生下', '一子', ',', '葬送', '了', '自已', '的', '恋情', '。', '姐姐', '死后', ',', '她', '也', '嫁给', '了', '祝鸿才', '。', '多年', '后', ',', '曼桢', '与', '世钧', '重逢', ',', '两人', '发现', ',', '前情', '虽', '在', ',', '后缘', '难续', '。', ' ', '上', '一页', '&', 'nbsp', ';', '[', '1', ']', '&', 'nbsp', ';', '[', '2', ']', '&', 'nbsp', ';', '[', '3', ']', '&', 'nbsp', ';', '[', '4', ']', '&', 'nbsp', ';', '[', '5', ']', '&', 'nbsp', ';', '[', '6', ']', '&', 'nbsp', ';', '[', '7', ']', '&', 'nbsp', ';', '[', '8', ']', '&', 'nbsp', ';', '[', '9', ']', '&', 'nbsp', ';', '下', '一页', '&', 'nbsp', ';'], 'C000023')
(['\n', '\n', '\n', '\n', '\u3000', '\u3000', '“', '猎鹰', '”', '试翼', '—', '—', '我国', '第三代', '高级', '教练机', '开始', '试飞', '\n', '\u3000', '\u3000', 'Chinese', ' ', 'Third', ' ', 'Generation', ' ', 'Training', ' ', 'Plane', ' ', '\n', 'Begins', ' ', 'Flight', ' ', 'Test', '\n', '\u3000', '\u3000', 'L', '-', '15', '总', '设计师', '对', '若干', '问题', '的', '解答', '\n', '\u3000', '\u3000', 'An', ' ', 'Interview', ' ', 'with', ' ', 'the', ' ', 'Chief', '-', 'Designer', ' ', 'of', ' ', 'L', '-', '15', '\n', '\u3000', '\u3000', '崎岖', '的', '“', '太行', '”', '之', '路', '—', '—', '我国', '新型', '大', '推力', '涡扇', '发动机', '的', '研制', '历程', '\n', '\u3000', '\u3000', 'Chinese', ' ', 'Home', ' ', 'Made', ' ', 'New', ' ', 'High', ' ', 'Thrust', ' ', 'Turbofan', ' ', 'Engine', ' ', 'Fielded', '\n', '\u3000', '\u3000', '伊朗', ':', '孤独', '的', '圣战', '\n', '\u3000', '\u3000', 'Iran', ' ', 'Focus', ':', ' ', 'Will', ' ', 'Iran', ' ', 'Be', ' ', 'the', ' ', 'Next', ' ', 'Iraq', '\n', '\u3000', '\u3000', '核', '萌芽', '的', '保护伞', '—', '—', '伊朗', '常规', '武装力量', '评介', '\n', '\u3000', '\u3000', 'An', ' ', 'Assessment', ':', ' ', 'The', ' ', 'Conventional', ' ', 'Armed', ' ', 'Forces', ' ', 'of', ' ', 'Iran', '\n', '\u3000', '\u3000', '专题', ':', '军用', '机器人', '技术', '\n', '\u3000', '\u3000', 'Military', ' ', 'Robots', ' ', 'Technology', '\n', '\u3000', '\u3000', '科学', '而', '非', '幻想', '—', '—', '美国', '军用', '机器人', '走向', '战场', '\n', '\u3000', '\u3000', 'It', "'", 's', ' ', 'Not', ' ', 'Fiction', ':', ' ', 'U', '.', 'S', ' ', 'Military', ' ', 'Robots', ' ', 'Go', ' ', 'To', ' ', 'War', '\n', '\u3000', '\u3000', '机器人', '技术', '及其', '军事', '应用', '—', '—', '访', '北京航空航天大学', 'ITM', '实验室', '\n', '\u3000', '\u3000', 'Robotics', ' ', 'Technology', ' ', 'and', ' ', 'Its', ' ', 'Military', ' ', 'Applications', '\n', '\u3000', '\u3000', '维护', '公众', '安全', '的', '机器人', '卫士', '—', '—', '武警', '装备', '专家', '谈', '反恐', '机器人', '\n', '\u3000', '\u3000', 'On', ' ', 'the', ' ', 'Anti', '-', 'Terror', ' ', 'Robots', ':', ' ', 'An', ' ', 'Interview', ' ', 'with', ' ', 'the', ' ', 'Researcher', ' ', 'from', ' ', 'Chinese', ' ', '\n', 'People', "'", 's', ' ', 'Armed', ' ', 'Police', ' ', 'Force', '\n', '\u3000', '\u3000', '以', '创新性', '思维', '发展', '中国', '的', '拐弯', '枪', '\n', '\u3000', '\u3000', 'An', ' ', 'Innovation', ':', ' ', 'Chinese', '-', 'Made', ' ', 'Corner', ' ', 'Shot', ' ', 'Weapon', ' ', 'System', '\n', '\u3000', '\u3000', '“', '探戈', '杀手', '”', '演绎', '美国', '未来', '潜艇', '技术', '\n', '\u3000', '\u3000', 'Tango', ' ', 'Bravo', ' ', 'Brings', ' ', 'Fundamental', ' ', 'Changes', ' ', 'to', ' ', 'U', '.', 'S', ' ', 'Next', ' ', 'Generation', ' ', 'Submarine', '\n', '\u3000', '\u3000', '展望未来', '的', '军用', '无线', '局域网', '\n', '\u3000', '\u3000', 'Future', ' ', 'Military', ' ', 'Wireless', ' ', 'LAN', ':', ' ', 'Wi', '-', 'Fi', ' ', 'or', ' ', 'WAPI', ',', ' ', 'WiMAX', ' ', 'or', ' ', 'McWILL', '?', '\n', '\u3000', '\u3000', '突破', '生理', '耐受', '极限', '—', '—', '欧美', '飞行员', '生命', '保障系统', '评介', '\n', '\u3000', '\u3000', 'The', ' ', 'Development', ' ', 'of', ' ', 'Pilots', ' ', 'Life', ' ', 'Support', ' ', 'System', ' ', 'in', ' ', 'the', ' ', 'U', '.', 'S', ' ', 'and', ' ', 'Europe', '\n', '\u3000', '\u3000', '不', '走', '别人', '走过', '的', '弯路', '—', '—', '外军', '信息化', '建设', '中', '的', '几点', '教训', '\n', '\u3000', '\u3000', 'Some', ' ', 'Lessons', ' ', 'Taken', ' ', 'from', ' ', 'Informationization', ' ', 'Construction', ' ', 'of', ' ', 'Foreign', ' ', 'Armed', ' ', '\n', 'Forces', '\n', '\u3000', '\u3000', '飞速', '扩展', '的', '美国陆军', '无人机', '训练', '\n', '\u3000', '\u3000', 'The', ' ', 'Training', ' ', 'for', ' ', 'U', '.', 'S', ' ', 'Army', ' ', 'UAV', ' ', 'Rapidly', ' ', 'Expanded', '\n', '\u3000', '\u3000', '美', '空军', '培养', '专职', '无人机', '飞行员', '\n', '\u3000', '\u3000', 'A', ' ', 'Career', ' ', 'Flying', ' ', 'UAVs', '\n', '\u3000', '\u3000', '评析', '美国', '两份', '防务', '评审', '报告', '\n', '\u3000', '\u3000', 'An', ' ', 'Contrast', ':', ' ', 'U', '.', 'S', ' ', 'Government', ' ', '06', "'", 'QDR', ' ', 'Report', ' ', 'and', ' ', 'A', ' ', 'Non', '-', 'Government', ' ', 'One', '\n', '\u3000', '\u3000', '美国', '人', '看', '日本', '国防工业', '发展', '\n', '\u3000', '\u3000', 'An', ' ', 'U', '.', 'S', ' ', 'Point', ' ', 'of', ' ', 'View', ':', ' ', 'The', ' ', 'Development', ' ', 'of', ' ', 'Japanese', ' ', 'Defense', ' ', 'Industry', '\n', '\u3000', '\u3000', '台湾岛', '及', '周边', '海区', '的', '地理', '与', '气候', '\n', '\u3000', '\u3000', 'Geographical', ' ', 'and', ' ', 'Climatic', ' ', 'Survey', ' ', 'of', ' ', 'Taiwan', ' ', 'Island', ' ', 'and', ' ', 'Its', ' ', 'Circumjacent', ' ', 'Sea', ' ', '\n', 'Area', '&', 'nbsp', ';', '&', 'nbsp', ';', ' '], 'C000008')
(['\u3000', '\u3000', '智威汤逊', '全球', 'CEO', ':', '大众传媒', '依然', '是', '品牌', '传播', '的', '好', '选择', '\n', '\u3000', '\u3000', '本报记者', '康健', '发自', '上海', '\n', '\u3000', '\u3000', '“', '想', '让', '品牌', '更', '快', '、', '更广地', '进入', '消费者', ',', '大众传媒', '仍然', '是', '很', '好', '的', '选择', '。', '”', '智威汤逊', '全球', 'CEO', ' ', 'Michael', ' ', 'Maedel', '近日', '在', '上海', '的', '办公室', '告诉', '《', '第一', '财经', '(', '相关', ':', '理财', ' ', '证券', ')', '日报', '》', '。', '他', '对', '有些', '人', '“', '电视', '、', '平面媒体', '失去', '意义', '”', '的', '观点', '不以为然', '。', '\n', '\u3000', '\u3000', '智威汤逊', '是', '美国', '最大', '的', '广告公司', '之一', ',', '与', '奥美', '广告', '一起', '隶属于', 'WPP', '集团', ',', '3', '月底', '刚刚', '收购', '了', '中国', '本土', '的', '上海', '奥维思', '市场营销', '服务公司', '。', '\n', '\u3000', '\u3000', '大众', '媒体', '和', '互动', '媒体', '对半', '\n', '\u3000', '\u3000', '针对', '新', '的', '媒体', '方式', '日益', '涌现', ',', '企业', '广告主', '投放', '广告', '越来越', '无所适从', '的', '情景', ',', 'Michael', '认为', ',', '广告主', '应该', '进行', '定性', '定量', '的', '分析', ',', '使', '任何', '投放', '都', '有', '清晰', '的', '出发点', ':', '消费者', '。', '要', '让', '媒介', '触及', '消费者', ',', '使', '他们', '更', '愿意', '来', '倾听', '公司', '。', '\n', '\u3000', '\u3000', '当然', ',', '在', '媒介', '越来越', '多', '的', '情形', '下', ',', '意味着', '传播方式', '的', '变化', '。', '过去', '主流', '的', '是', '大众传播', ',', '现在', '互动性', '和', '定制', '性', '带来', '了', '新', '的', '挑战', '—', '—', '如何', '让', '品牌', '与', '消费者', '更加', '互动', '。', '\n', '\u3000', '\u3000', '智威汤逊', '东北亚', '区域', '总监', '兼大', '中国区', 'CEO', '唐锐涛', '则', '认为', ',', '中国', '面临', '两个', '挑战', ':', '品牌', '主张', '明确化', '和', '如何', '深化', '与', '消费者', '的', '关系', '。', '\n', '\u3000', '\u3000', '他', '认为', ',', '大众', '品牌', '并未', '失去', '其', '价值', ',', '借助', '大众', '媒体', '可以', '清楚', '地', '传达', '品牌', '的', '真实', '含义', '。', '而', '在', '此基础', '上', ',', '还', '需要', '更新', '的', '形式', '使', '产品', '和', '消费者', '的', '关系', '进一步', '深化', '。', '通过', '互动', '媒体', ',', '可以', '将', '以往', '被动', '的', '关系', '变成', '主动', '对话', '的', '消费者', '关系', '。', '\n', '\u3000', '\u3000', '唐锐涛', '的', '经验', '法则', '是', ',', '在', '进行', '投放', '的', '时候', ',', '大众', '媒体', '和', '新', '媒体', '“', '对半开', '”', ',', '前者', '致力于', '建立', '品牌', ',', '后者', '用于', '深化', '与', '消费者', '关系', '。', '\n', '\u3000', '\u3000', '同时', ',', '产品', '根据', '消费者', '参与', '的', '程度', '也', '分为', '高', '消费者', '参与度', '产品', '和', '低', '消费者', '参与度', '产品', '。', '使用', '媒介', '取决于', '产品', '本身', '的', '复杂度', '。', '如', '饼干', '等', '不假思索', '就', '购买', '的', '产品', ',', '大众', '媒体', '作用', '比较', '大', '。', '汽车', '等', '奢侈品', '需要', '增加', '对话', '和', '互动', ',', '让', '消费者', '深入', '这个', '品牌', '。', '\n', '\u3000', '\u3000', '全球', '品牌', ',', '本土', '特色', '\n', '\u3000', '\u3000', 'Michael', '特别强调', '品牌', '的', '全球', '定位', '和', '本地', '表述', '。', '他', '提到', ',', '即便', '广告主', '是', '洗衣机', ',', '在', '各个', '市场', ',', '洗衣机', '的', '价格', '跟', '消费者', '的', '工资', '比例', '不', '一样', ',', '有些', '市场', '用', '2', '天', '的', '工资', '就', '可以', '买', '一台', ',', '而', '有些', '市场', ',', '消费者', '需要', '用', '自己', '三个', '月', '的', '工资', '才能', '购买', '到', '。', '这样', '的', '情况', '下', ',', '消费者', '的', '参与度', '就', '完全', '不', '一样', '了', '。', '那些', '用', '三个', '月工资', '才能', '买得起', '洗衣机', '的', '人会花', '更', '多', '时间', '去', '了解', '产品', '的', '性能', '是否', '耐用', ',', '这', '跟', '成熟', '市场', '完全', '不同', '。', '\n', '\u3000', '\u3000', '“', '本地化', '并', '不', '意味着', '把', '全球', '广告', '翻译成', '中文', ',', '这是', '一种', '拙劣', '的', '方式', '。', '”', 'Michael', ' ', '称', '。'], 'C000008')
(['\u3000', '\u3000', '全国', '治理', '医药', '购销', '领域', '商业', '贿赂', '专项', '工作', '正在', '轰轰烈烈', '地', '展开', ',', '却', '有', '骗子', '趁机', '诈骗', '医务人员', '。', '日前', ',', '广东省', '卫生厅', '向', '全省', '医务人员', '发出', '了', '“', '谨防', '有人', '利用', '打击', '商业', '贿赂', '诈骗', '”', '的', '提示', '。', '\n', '\u3000', '\u3000', '治理', '医药', '购销', '领域', '商业', '贿赂', '专项', '工作', '于', '3', '月底', '在', '全国', '拉开帷幕', '之后', ',', '各地', '卫生', '行政部门', '积极', '贯彻', '中央', '精神', ',', '部署', '专项', '治理', '工作', '。', '近来', ',', '广东省', '许多', '医务人员', '突然', '收到', '手机短信', '或者', '信件', ',', '被', '告知', '希望', '其', '认真', '自查自纠', ',', '将', '收受', '的', '红包', '和', '回扣', '款项', '主动', '上缴', '汇入', '某个', '指定', '账号', ',', '争取', '宽大处理', '。', '然而', '广东省', '卫生', '行政部门', '还', '没有', '设立', '回扣', '款', '上缴', '账户', ',', '更', '没有', '向', '医务人员', '发出', '过', '上缴', '款项', '的', '通知', '。', '为此', ',', '广东省', '卫生厅', '向', '全省', '的', '医疗机构', '和', '医务人员', '下发', '紧急通知', ',', '提醒', '谨防', '受骗上当', '。'], 'C000024')
(['\u3000', '\u3000', '\u3000', '世界', '的', '旅游业', '越来越', '熟悉', '一个', '新名词', '—', '—', '中国', '的', '黄金周', '。', '每到', '这个', '时候', ',', '中国', '都', '会', '迎来', '一次', '旅游', '高潮', ',', '一直', '席卷', '周边', '甚至', '更为', '遥远', '的', '一些', '国家', '和', '地区', ',', '使', '他们', '也', '跟', '随着', '这种', '固定', '的', '周期', '迎来', '一个个', '旅游', '、', '消费', '旺季', '。', '\n', '\u3000', '\u3000', '尽管', '出入境', '管理', '部门', '尚未', '公布', '具体', '数字', ',', '全国假日办', '负责人', '预测', '说', ',', '今年', '“', '五一', '”', '黄金周', ',', '出境', '旅游', '规模', '很', '可能', '超过', '去年', '“', '五一', '”', '黄金周', '1000', '多万人次', '的', '水平', '。', '\n', '\u3000', '\u3000', '中国', '游客', '涌', '来', '\n', '\u3000', '\u3000', '“', '标志', '”', '泰国', '从', '海啸', '中', '复苏', '\n', '\u3000', '\u3000', '5', '月', '2', '日', ',', '从事', '服装设计', '的', '胡明明', '第四次', '飞往', '泰国', '普吉岛', '度假', '。', '黄金周', '对', '她', '而言', ',', '就是', '躺', '在', '普吉岛', '沙滩', '上', ',', '晒', '一周', '太阳', '。', '作为', '中国', '公民', '最早', '的', '旅游', '目的地', '代表', '景点', ',', '普吉岛', '代表', '了', '东南亚', '国家', '在', '中国', '消费者', '心目', '中', '的', '独特', '地位', ':', '回头客', '越来越', '多', '。', '\n', '\u3000', '\u3000', '泰国', '国家旅游局', '的', '数据', '显示', ',', '2005', '年', '前往', '普吉', '的', '中国', '旅游者', '达', '10', '万人次', '左右', ',', '预计', '2006', '年', '将', '突破', '15', '万', ',', '从而', '成为', '泰国', '南部', '旅游业', '在', '印度洋', '海啸', '后', '全面', '恢复', '的', '“', '重要', '标志', '”', '。', '\n', '\u3000', '\u3000', '目前', '中国', '人', '出境游', '基本', '都', '是', '第一次', '出国', ',', '因此', '更', '看重', '价格', '。', '“', '中国', '人', '喜欢', '出访', '大城市', ',', '且', '往往', '都', '是', '走马观花', ',', '到', '哪里', '都', '要', '先', '照相', '。', '”', '一', '旅行社', '总经理', '助理', '郭明', '告诉', '记者', '。', '出境', '爱', '购物', '可能', '是', '中国', '人', '出境游', '的', '又', '一大', '特色', '。', '\n', '\u3000', '\u3000', '俄罗斯', '、', '蒙古', '游', '\n', '\u3000', '\u3000', '国人', '今年', '出游', '“', '新亮点', '”', '\n', '\u3000', '\u3000', '东南亚', '国家', '打出', '“', '山水相连', '”', '牌', ',', '韩国', '和', '日本', '旅游界', '则', '希望', '以', '“', '文化', '渊源', '”', '赢得', '中国', '“', '休闲', '商机', '”', '。', '在', '《', '大长', '今', '》', '、', '“', '韩流', '”', '等', '文化', '因素', '刺激', '之下', ',', '中', '韩', '两国之间', '的', '航线', '变得', '越来越', '繁忙', '。', '就', '在', '“', '五一', '”', '前', ',', '大', '韩', '航空', '宣布', '计划', '5', '年内', '将', '韩中', '航线', '增至', '50', '条', '。', '\n', '\u3000', '\u3000', '旅游', '交通', '经济', '分析', '师刘斌', '说', ',', '2006', '年', '“', '五一', '”', '黄金周', ',', '中国', '周边旅游', '的', '新亮点', '是', '俄罗斯', '、', '蒙古国', '。', '随着', '夏季', '到来', ',', '北亚', '风光', '呈现出', '独特', '的', '吸引力', '。', '目前', ',', '俄罗斯', '专门', '为', '中国', '旅游者', '成立', '的', '“', '无国界', '世界', '”', '协会', '正', '全力以赴', '利用', '中', '俄', '两国', '互办', '“', '国家', '年', '”', '的', '机遇', ',', '吸引', '更', '多', '中国', '游客', '“', '北上', '消费', '”', '。', '\n', '\u3000', '\u3000', '羡慕', '黄金周', '\n', '\u3000', '\u3000', '印度', '日本', '都', '“', '心动', '”', '了', '\n', '\u3000', '\u3000', '旅游', '观察家', '指出', ',', '中国', '“', '旅游', '休闲', '”', '商机', ',', '正', '从', '东南亚', '向', '东北亚', '“', '扇形', '展开', '”', ',', '并', '惠及', '越来越', '多', '的', '邻邦', '。', '\n', '\u3000', '\u3000', '刘斌', '认为', ',', '目前', '东南亚', '抢', '得', '中国', '“', '休闲', '潮', '”', '之先', ',', '可以', '为', '中国', '东盟', '经济', '贸易', '一体化', '“', '推波助澜', '”', '。', '东北亚地区', '作为', '中国', '主要', '客源', '市场', ',', '“', '双向', '流动', '”', '将', '催生', '“', '东北亚', '旅游圈', '”', ',', '从而', '与', '东南亚', '旅游圈', '南北', '呼应', '。', '这样', ',', '中国', '人', '的', '休闲', '不仅', '将', '成为', '所有', '周边国家', '的', '商机', ',', '而且', '将', '成为', '中国', '与', '这些', '国家', '睦邻友好', '的', '“', '休闲', '纽带', '”', '。', '\n', '\u3000', '\u3000', '从', '发展', '旅游', '经济', '的', '角度', '来说', ',', '中国', '的', '黄金周', '无疑', '让', '各国', '羡慕', '。', '印度', '的', '一家', '报纸', '曾', '对', '中国政府', '“', '聪明', '并且', '执行', '有力', '的', '黄金周', '政策', '”', '大加', '赞赏', ',', '认为', '印度政府', '应当', '向', '中国', '学习', '。', '而', '日本', '为了', '促进', '旅游', '、', '拉动', '内需', ',', '也', '修改', '了', '“', '节日', '法', '”', ',', '人为', '地', '制造', '出', '更', '多', '的', '长假', ',', '方便', '人们', '外出', '旅游', '或', '安排', '各种', '休闲活动', '。', '(', '新华', '每日电讯', ')', '\n', '\u3000', '\u3000', '新闻', '链接', '\n', '\u3000', '\u3000', '悉尼', '\n', '\u3000', '\u3000', '“', '处处', '是', '中国', '人', ',', '还', '以为', '回国', '了', '”', '\n', '\u3000', '\u3000', '“', '到', '悉尼', '来', '旅游', ',', '到处', '都', '能', '看到', '中国', '人', '的', '面孔', '。', '要不是', '看到', '外国人', '多点', ',', '还', '以为', '又', '回到', '了', '中国', '呢', '!', '”', '一位', '来自', '北京', '的', '张姓', '游客', '说', '。', '\n', '\u3000', '\u3000', '这', '也', '是', '不少', '中国', '游客', '初到', '澳大利亚', '时', '的', '感觉', '。', '去年', ',', '有', '28', '万', '中国', '游客', '赴', '澳', '旅游', ',', '占来', '澳', '游客', '总数', '的', '5.2%', '。', '\n', '\u3000', '\u3000', '在', '去年', '12', '月', '澳大利亚联邦政府', '发布', '的', '旅游', '战略', '中', ',', '中国', '被', '认为', '是', '澳', '旅游业', '增长', '最快', '的', '市场', '。', '据澳', '旅游业', '预测', '委员会', '预计', ',', '中国', '到', '澳大利亚', '旅游', '的', '人数', '将', '以', '每年', '16.5%', '的', '速度', '增长', ',', '到', '2014', '年', ',', '将会', '有', '110', '万', '中国', '游客', '来澳', '旅游', ',', '澳大利亚', '每', '7', '名', '游客', '中', '就', '有', '1', '名', '中国', '公民', '。', '届时', ',', '中国', '将', '有望', '成为', '澳大利亚', '最大', '的', '客源国', ',', '中国', '游客', '每年', '将', '为', '澳', '旅游业', '贡献', '60', '亿澳元', '。', '\n', '\u3000', '\u3000', '巴黎', '\n', '\u3000', '\u3000', '中国', '人', '不再', '“', '上车', '睡觉', '下车', '拍照', '”', '\n', '\u3000', '\u3000', '四五', '月份', '本是', '中国', '人', '赴法', '旅游', '的', '淡季', ',', '但', '“', '五一', '”', '长假', '却是', '淡季', '中', '的', '旺季', ',', '法国', '各大', '华人', '旅行社', '在此期间', '接待', '的', '中国', '游客', '数量', '几乎', '是', '平时', '的', '两倍', '。', '而', '中国', '人', '对', '赴', '法国', '乃至', '欧洲', '旅游', '的', '观念', '也', '发生', '改变', '。', '\n', '\u3000', '\u3000', '据', '法国', '文华', '旅行社', '总经理', '陈超英', '介绍', ',', '过去', ',', '中国', '游客', '总想', '在', '最', '短时间', '内以', '最少', '费用', '游览', '到', '最', '多', '数量', '的', '法国', '及其', '周边国家', '景点', '。', '一时间', ',', '“', '上车', '睡觉', ',', '下车', '拍照', ',', '一问', '什么', '都', '不', '知道', '”', '这', '段', '顺口溜', '成', '了', '此类', '贪多', '求全', '的', '旅游', '方式', '的', '生动', '写照', '。', '\n', '\u3000', '\u3000', '几年', '过去', ',', '随着', '出境游', '机会', '增加', ',', '越来越', '多', '的', '中国', '游客', '迷上', '了', '欧美', '游客', '所', '青睐', '的', '休闲游', '和', '主题', '游', '。', '陈超英', '说', ',', '以', '文华', '旅行社', '为例', ',', '参加', '休闲游', '和', '主题', '游', '的', '中国', '游客', '三年', '前', '只', '占', '中国', '游客', '总数', '的', '5%', ',', '现在', '已', '占', '到', '了', '30%', ',', '预计', '三年', '后', '将', '达到', '50%', '左右', '。', '他', '说', ',', '这', '不仅', '说明', '中国', '游客', '的', '消费', '能力', '提高', ',', '也', '说明', '他们', '的', '消费', '心理', '趋于', '成熟', '。', '\n', '\u3000', '\u3000'], 'C000016')
(['\u3000', '\u3000', '三九医药', '(', '000999', ')', '和', '三九生化', '(', '000403', ')', '今日', '同时', '发布公告', ',', '三九医药', '转让', '三九生化', '38.11', '%', '股权', '事宜', '获得', '国资委', '批准', ',', '三九医药', '将', '所', '持有', '的', '三九生化', '6162.1064', '万股', '和', '1906.0936', '万股', '国有', '法人股', '分别', '转让', '给', '振兴', '集团', '有限公司', '和', '山西', '恒源', '煤业', '有限公司', '。', '\n', '\u3000', '\u3000', '协议', '签订', '一年', '后', ',', '股权', '转让', '终于', '取得', '重大进展', ',', '也', '为', '三九集团', '的', '重组', '工作', '打下', '更', '坚实', '的', '基础', '。', '但', '在', '这', '一年', '中', ',', '三九生化', '却', '发生', '了', '大', '变化', '。', '\n', '\u3000', '\u3000', '根据', '年报', ',', '三九生化', '2005', '年度', '亏损', '5.21', '亿元', ',', '而', '2004', '年', '亏损额', '为', '1.98', '亿元', ',', '同时', ',', '每股', '净资产', '由', '2004', '年', '的', '2.55', '元', '变为', '-', '0.05', '元', ',', '净利润', '和', '净资产', '发生', '大幅', '变动', '。', '但', '在', '双方', '签订', '的', '协议', '中', ',', '收购价格', '为', '每股', '2.55', '元', '。', '\n', '\u3000', '\u3000', '某', '券商', '投行', '人士', '认为', ',', '由于', '当时', '双方', '所签', '的', '协议', '价格', '是', '以', '2004', '年', '的', '审计报告', '为', '依据', '的', ',', '时隔', '一年', ',', '公司', '的', '审计', '结果', '发生', '重大', '变化', ',', '如果', '仍然', '用', '2004', '年', '的', '审计', '结果', '来', '进行', '交易', '似乎', '并', '不', '合适', '。', '\n', '\u3000', '\u3000', '也', '有', '业内人士', '认为', ',', '签订', '的', '协议', '具有', '法律效力', ',', '国资委', '的', '批准', '是', '协议', '生效', '的', '前提', '。', '如今', '既然', '已经', '获准', ',', '就', '应该', '按照', '协议', '的', '价格', '执行', '。', '\n', '\u3000', '\u3000', '此前', '三九生化', '发布', '的', '2005', '年度报告', '被', '审计', '机构', '出具', '了', '非标', '意见', ',', '14', '位', '公司', '高管', '也', '对', '年报', '表示', '质疑', '。', '围绕', '股权', '转让', ',', '相关', '各方', '不知', '是否', '还会', '发生', '争议', '。', '但', '业内人士', '评价', ',', '对', '公司', '而言', ',', '股权', '顺利', '转让', ',', '让', '公司', '步入', '正常', '发展', '的', '轨道', ',', '这才', '是', '最', '重要', '的', '。'], 'C000010')
(['\n', '\u3000', '\u3000', '中新网', '5', '月', '9', '日电', ' ', '\n', '据', '共同社', '报道', ',', '围绕', '导弹', '防御', '系统', '(', 'MD', ')', '问题', ',', '日本', '海上', '自卫队', '9', '日', '宣布', ',', '将', '派', '海上', '自卫队', '“', '宙斯', '盾', '”', '舰', '参加', '美国', '即将', '于', '6', '月', '在', '夏威夷', '近海', '实施', '的', '海基型', '拦截导弹', '(', 'SM3', ')', '的', '拦截', '试验', ',', '对', '目标', '进行', '雷达', '跟踪', '。', '\n', '\u3000', '\u3000', '“', '宙斯', '盾', '”', '护卫舰', '是', '首次', '参加', '此类', '拦截', '演习', '。', '海上', '自卫队', '幕僚长', '(', '相当于', '参谋长', ')', '斋藤', '隆', '表示', ',', '“', '将', '力争', '提高', '双方', '在', '海上', '的', '相互', '协调性', '”', ',', '由此可见', ',', '日美', '在', 'MD', '方面', '共享', '信息', '等', '合作', '体制', '将', '进一步', '得到', '确立', '。', '\n', '\u3000', '\u3000', '据', '海上', '自卫队', '透露', ',', '预定', '参加', '此次', '演习', '的', '是', '曾经', '根据', '《', '反恐', '特别', '措施', '法', '》', '在', '阿拉伯海', '上', '进行', '过', '海上', '燃油', '补给', '活动', '的', '“', '雾岛', '(', 'KIRISHIMA', ')', '”', '号', '(', '7250', '吨', ')', '。', '美国', '海军', '的', '“', '宙斯', '盾', '”', '舰', '计划', '用', 'SM3', '对', '模拟', '弹道导弹', '进行', '拦截', ',', '而', '“', '雾岛', '”', '号', '将', '跟踪', '模拟', '弹道导弹', '的', '轨迹', '。', '\n', '\u3000', '\u3000', '“', '雾岛', '”', '号', '计划', '于', '本月', '从', '位于', '神奈川县', '的', '横须贺', '基地', '出发', ',', '在', '参加', '拦截', '试验', '结束', '后', '还', '将', '参加', '环', '太平洋', '联合演习', '。', '\n', '\u3000', '\u3000', '美国', '迄今为止', '曾', '6', '次', '成功', '地', '进行', '了', 'SM3', '拦截', '试验', '。', '日本政府', '将', '于', '2007', '年度', '年底', '开始', '为', '海上', '自卫队', '的', '”', '宙斯', '盾', '”', '护卫舰', '装备', 'SM3', '。'], 'C000024')
(['\u3000', '\u3000', '新华网', '深圳', '3', '月', '3', '日电', '(', '记者', '贾文军', ')', '全国', '拳击', '锦标赛', '3', '日', '在', '深圳市', '龙岗', '体育中心', '拉开战幕', ',', '在', '接下来', '的', '一周', '里', ',', '来自', '全国', '各地', '的', '200', '多名', '拳击', '健儿', '将', '在', '这里', '展开', '角逐', '。', '\n', '\n', '\u3000', '\u3000', '本次', '锦标赛', '由', '国家体育总局', '拳击', '跆拳道', '运动', '管理中心', '主办', '。', '比赛', '设置', '了', '51', '公斤', '、', '57', '公斤', '、', '64', '公斤', '、', '75', '公斤', '和', '91', '公斤', '5', '个', '级别', ',', '全国', '各地', '共有', '45', '支', '代表队', '参赛', '。', '\n', '\n', '\u3000', '\u3000', '此前', ',', '中国', '拳击', '队', '已经', '在', '深圳', '进行', '了', '3', '个', '月', '的', '冬训', '。', '国家体育总局', '拳击', '跆拳道', '运动', '管理中心', '副', '主任', '崔', '富国', '表示', ',', '要', '通过', '这次', '比赛', '来', '检验', '冬训', '的', '成果', ',', '也', '要', '根据', '比赛', '成绩', '为', '2008', '年', '北京', '奥运会', '选拔', '优秀人才', '。', '\n'], 'C000024')

AODE分类器

import numpy as np


def getDataSet():
    dataSet = [
        ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, 1],
        ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, 1],
        ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, 1],
        ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, 1],
        ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, 1],
        ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, 1],
        ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, 1],
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, 1],
        ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, 0],
        ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, 0],
        ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, 0],
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, 0],
        ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, 0],
        ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, 0],
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, 0],
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, 0],
        ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, 0]
    ]

    features = ['色泽', '根蒂', '敲声', '纹理', '脐部', '触感']

    featureDic = {}
    for i in range(len(features)):
        featureList = [example[i] for example in dataSet]
        uniqueFeature = list(set(featureList))
        featureDic[features[i]] = uniqueFeature

    dataSet = np.array(dataSet)
    return dataSet, features, featureDic


def AODE(dataSet, data, features, featureDic):
    m, n = dataSet.shape
    n = n - 3       # 特征不取连续值的属性,如密度和含糖量。
    pDir = {}       # 保存三个值。好瓜的可能性,坏瓜的可能性,和预测的值。
    for classLabel in ["好瓜", "坏瓜"]:
        P = 0.0
        if classLabel == "好瓜":
            sign = '1'
        else:
            sign = '0'
        extrDataSet = dataSet[dataSet[:, -1] == sign]    # 抽出类别为sign的数据
        for i in range(n):                               # 对于第i个特征
            xi = data[i]
            # 计算classLabel类,第i个属性上取值为xi的样本对总数据集的占比
            Dcxi = extrDataSet[extrDataSet[:, i] == xi]  # 第i个属性上取值为xi的样本数
            Ni = len(featureDic[features[i]])            # 第i个属性可能的取值数
            Pcxi = (len(Dcxi) + 1) / float(m + 2 * Ni)
            # 计算类别为c且在第i和第j个属性上分别为xi和xj的样本,对于类别为c属性为xi的样本的占比
            mulPCond = 1
            for j in range(n):
                xj = data[j]
                Dcxij = Dcxi[Dcxi[:, j] == xj]
                Nj = len(featureDic[features[j]])
                PCond = (len(Dcxij) + 1) / float(len(Dcxi) + Nj)
                mulPCond *= PCond
            P += Pcxi * mulPCond
        pDir[classLabel] = P

    if pDir["好瓜"] > pDir["坏瓜"]:
        preClass = "好瓜"
    else:
        preClass = "坏瓜"

    return pDir["好瓜"], pDir["坏瓜"], preClass


def test_accuracy(dataSet, features, featureDic):
    cnt = 0
    for data in dataSet:
        _, _, pre = AODE(dataSet, data, features, featureDic)
        if (pre == '好瓜' and data[-1] == '1') or (pre == '坏瓜' and data[-1] == '0'):
            cnt += 1
    return cnt / float(len(dataSet))


def main():
    dataSet, features ,featureDic = getDataSet()
    pG, pB, pre = AODE(dataSet, dataSet[0], features, featureDic)
    print("pG = ", pG)
    print("pB = ", pB)
    print("pre = ", pre)
    print("real class = ", dataSet[0][-1])
    print(test_accuracy(dataSet, features, featureDic))


if __name__ == '__main__':
    main()
pG =  0.08503601601454483
pB =  0.0028579262019532985
pre =  好瓜
real class =  1
0.9411764705882353

本文标签: 垃圾邮件 朴素 西瓜 恶意 留言