跳转至

多模态谣言检测

任务说明

在当今信息爆炸的时代,社交媒体平台上充斥着大量的信息,其中不乏谣言和虚假信息。这些谣言可能会对社会产生负面影响,因此,如何有效地检测和识别谣言成为了一个重要的研究课题。多模态谣言检测利用文本、图像、视频等多种数据源,结合多模态信息进行谣言识别,能够提高检测的准确性和鲁棒性。

任务要求

  1. 研究目标:设计并实现一个多模态谣言检测系统,能够从给定的数据集中识别出谣言信息。
  2. 数据预处理:对数据集进行清洗和预处理,包括文本的分词、去停用词,图像的标准化处理等。
  3. 模型设计:设计一个多模态融合模型,可以选择使用深度学习模型(如CNN, LSTM, Transormer等模型)进行谣言检测。
  4. 模型训练与评估:使用训练集对模型进行训练,并在测试集上进行评估。
  5. 结果分析:分析模型的检测结果,找出模型的优缺点,并提出改进建议。
  6. 报告撰写:撰写一份详细的报告,介绍研究背景、方法、实验结果和结论。

使用的数据集

本次大作业将使用公开的多模态谣言检测数据集,包含:

评估指标需要包括谣言和非谣言的精确率(Precision)、召回率(Recall)和F1-score。

报告撰写

  • 报告应至少包含以下部分
  • 摘要:简要概述研究的背景、目的、方法、主要结果和结论。
  • 引言:介绍研究背景和意义。
  • 相关工作:综述与多模态谣言检测相关的已有研究,分析现有方法的优缺点。
  • 方法:详细描述数据预处理、模型设计和训练过程。
  • 实验:详细展示和分析实验结果。
  • 结论:总结研究成果,并提出未来工作方向。

参考方案

请至少使用以下文章作为baseline,并在报告中进行对比分析: - Multimodal Fusion with Recurrent Neural Networks for Rumor Detection on Microblogs 论文地址

此外,鼓励同学们在研究过程中尽可能参考和对比更新的模型和方法。最终评分将综合考虑报告的完整性和模型的创新性以及在谣言检测任务中的实际性能表现。