目前算法对于主观程度和情绪极性的反映非常直接,体现了情感分析的有效性。但现有算法可能存在不足:
- 主要依赖TextBlob的现成数据,没有对其进行更复杂的排列组合和衍生特征分析。
- 虽然追求更好的效果,但担心复杂模型容易过拟合,反而影响稳定性。
建议:
- 在保留现有TextBlob基础的情况下,尝试对其提供的数据进行统计、组合、交叉特征以及模式挖掘,深入分析情感变化的细致面貌。
- 探索更多面向文本本身的数据排列组合方式,比如基于句法结构、词频分布、同义反义对等手段,进一步丰富特征表达。
- 保持模型的简洁性,避免因引入过多高级模型而导致泛化能力减弱。
- NewsAPI免费版虽然只允许调用一个月内的信息,但是反而可能避免了过拟合情况。目前市场情绪变化非常迅速,一个月的时间已经充足。
欢迎相关建议或补充!
目前算法对于主观程度和情绪极性的反映非常直接,体现了情感分析的有效性。但现有算法可能存在不足:
建议:
欢迎相关建议或补充!