Skip to content

SecondDim/analysis-news

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

analysis-news

TODO

  1. 文字雲
  2. 情感分析(?)(政治分類)
  3. 時間分析
  4. 統計分析
  5. 詞性分析
  6. 作者分析
  7. 視覺化結果

Pre request

  1. pip
pip install -U ckiptagger

# tensorflow
pip install -U tf
  1. Download tensorflow model files

select one

http://ckip.iis.sinica.edu.tw/data/ckiptagger/data.zip
https://drive.google.com/drive/folders/105IKCb88evUyLKlLondvDBoh7Dy_I1tm
https://drive.google.com/drive/folders/15BDjL2IaX3eYdFVzT422VwCb743Hrbi3

Usage

# 啟動 app
python app.py
# 分析結果
# 五分鐘內的單詞出現次數
python bash.py pos5

# 五分鐘內的實體出現次數
python bash.py ner5

# 一小時內的實體出現次數
python bash.py ner60

# 二十四內的實體出現次數
python bash.py ner24

參考資料

-----相關套件-----

jieba

HanLP

snownlp

CKIP Lab

https://ckip.iis.sinica.edu.tw/resource

ckiptagger

ckip-transformers

ckipnlp

----相關文章-----

以 jieba 與 gensim 探索文本主題:五月天人生無限公司歌詞分析 ( I )

如何用Python做情感分析?

【不是工程師,也可以作文本分析】用 R 與 Python 語言,七步驟解決文本挖掘的一切痛苦

Day 06 - 用中研院 CKIP Transformers 做中文斷詞,台灣國語不再結巴 - 親手打造推薦系統

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages