Simple sentiment analysis using regular expression: Difference between revisions

Jump to navigation Jump to search
no edit summary
mNo edit summary
No edit summary
 
(7 intermediate revisions by the same user not shown)
Line 45: Line 45:
#* 方式: 搜尋不包含「喜歡」、「樂愛」
#* 方式: 搜尋不包含「喜歡」、「樂愛」
#* 搜尋: {{kbd | key =<nowiki>^((?!(喜歡|樂愛)).)*$</nowiki>}}
#* 搜尋: {{kbd | key =<nowiki>^((?!(喜歡|樂愛)).)*$</nowiki>}}
== 輸入文字範例3 ==
「不」、「愉快」相隔幾字
<pre>
與 pokeman 的冒險,會有不少的爭執、不愉快
與 pokeman 的相處比較不會因為這個方面而鬧得不愉快
和 pokeman 相處滿愉快
鬧的心情不是很愉快
沒有很愉快
很愉快
</pre>
三種類型情緒
# 正面情緒 (positive sentiment)
#* 方式: 搜尋包含「愉快」但是前面不包含「不」或「沒」字
#* 搜尋: 搜尋: {{kbd | key =<nowiki>^((?![不|沒]).)+(愉快)</nowiki>}} 或 {{kbd | key =<nowiki>^([^不|沒])+(愉快)</nowiki>}} ([https://regex101.com/r/ABzfEj/1 線上測試])
# 負面情緒 (negative sentiment)
#* 方式: 搜尋包含「愉快」但是前面包含「不」或「沒」字
#* 搜尋: {{kbd | key =<nowiki>([不|沒]).*(愉快)</nowiki>}}
# 中性情緒 (neural sentiment)
#* 方式: 搜尋不包含「愉快」、「喜歡」、「樂愛」
#* 搜尋: {{kbd | key =<nowiki>^((?!(愉快|喜歡|樂愛)).)*$</nowiki>}}


== 備註 ==
== 備註 ==
Line 50: Line 73:
* 情緒文字需要事先建立詞庫。
* 情緒文字需要事先建立詞庫。
* 詞庫文字大量時,效能未知。
* 詞庫文字大量時,效能未知。
* 本方法沒有處理: 段落文字不包含關鍵字,需要透過前後文判斷情緒時。


issues


* 以標點符號當作斷點


延伸閱讀
== 延伸閱讀 ==
* [https://en.wikipedia.org/wiki/Sentiment_analysis Sentiment analysis - Wikipedia]
* [https://en.wikipedia.org/wiki/Emotion_classification Emotion classification - Wikipedia]
* [http://www.rexegg.com/regex-lookarounds.html Lookahead and Lookbehind Tutorial—Tips &Tricks]
* [http://www.rexegg.com/regex-lookarounds.html Lookahead and Lookbehind Tutorial—Tips &Tricks]
* [http://www.alchemyapi.com/products/alchemylanguage/sentiment-analysis Sentiment Analysis | AlchemyAPI]


[[Category:RegExp]] [[Category:Software]] [[Category:Programming]] [[Category:Data Science]] [[Category:Search]] [[Category:Text file processing]]
[[Category:Regular expression]] [[Category:Software]] [[Category:Programming]] [[Category:Data Science]] [[Category:Search]] [[Category:String manipulation]]
Anonymous user

Navigation menu