網(wǎng)站建設(shè)定制通過Python機(jī)器學(xué)習(xí)進(jìn)行網(wǎng)頁文本的情感分析
- 編輯:admin -Python的機(jī)器學(xué)習(xí)有樸素貝葉斯、邏輯回歸和支持向量機(jī)幾種分類器模型, 用于網(wǎng)頁文本的情感挖掘的模型訓(xùn)練。
通過Python機(jī)器學(xué)習(xí)進(jìn)行網(wǎng)頁文本的情感分析。Python的機(jī)器學(xué)習(xí)有樸素貝葉斯、邏輯回歸和支持向量機(jī)幾種分類器模型, 用于網(wǎng)頁文本的情感挖掘的模型訓(xùn)練。
在網(wǎng)頁文本分詞后的詞組被表示成基于tf-idf的空間向量形式, 樸素貝葉斯分類器根據(jù)這些向量計(jì)算得出每個主觀文本屬于情感詞典中情感類別的概率, 最大概率即是文本所屬的主觀情感類別。

基于樸素貝葉斯分類模型的機(jī)器學(xué)習(xí)情感識別算法是將含有訓(xùn)練文本集合和驗(yàn)證集合兩部分的輸入語句集經(jīng)過文本預(yù)處理、文本表示和文本主觀性分類模型特征選擇后得到輸入語句。用特征表示后, 經(jīng)過樸素貝葉斯分類模型的分類算法得到主觀性文本的情感分類結(jié)果, 最后得到文本客觀句集和文本主觀句集, 從而識別出網(wǎng)頁文本的情感。
