基于神经网络的虚假评论识别系统
备注:
数据处理时,应该以utf-8编码,不然读出来的数据较乱,修改数据形式,读取Excel文件,以utf-8编码
打乱数据集使得最后的结果更加合理
添加测试集验证模型
测试集:训练集=2:8
在训练集的过程中添加验证集,比例为1:9
最后的下面如下图所示。
数据比例:
模型结构:
模型指标:
建议:
词向量的维度太大,句子太短,导致句子向量比较稀疏,可以修改句子维度大小;
同时可以修改代码生成训练过程中的acc和loss折线图,类似下面的loss图(80块钱优化上述建议代码)
代码流程说明:
主要函数: