实验五：Transformer与预训练语言模型¶

开始之前¶

我们在本次实验中使用Jupyter Notebook进行实验，请参考Jupyter Notebook使用，按照文档中详细步骤进行操作，完成Jupyter Notebook的配置。

本次实验分为两个任务：Transformer（约90分钟）和Bert文本分类实验（约60分钟）。

在这个任务中，你将：

主要内容包括：

通过本任务，你将掌握位置编码的基本原理，了解多头自注意力机制原理与实现，并能够在PyTorch框架下使用Transformer Encoder设计训练一个文本分类模型。

在这个任务中，你将：

主要内容包括：

通过本任务，你将掌握使用GPU训练模型，了解预训练语言模型，并能够使用预训练语言模型进行分类。

实验完成后，请提交以下材料：

本次提交的内容为: 实验五要求提交的内容，具体要求请参见实验网站（https://zhiweinju.github.io/nju-dl-lab-2025spring/）
提交的报告文件请以PDF文件格式上传到selearning网站，上传文件的文件命名格式为: 学号_姓名_实验五.pdf，比如：123456789_张三_实验五.pdf
其他提交文件（如运行成功的Jupyter Notebook文件），请加上前缀: 学号_姓名_，比如: 123456789_张三_lab5.ipynb
本次提交的截止时间为 3月28日23:59:59
对于迟交的处理: 迟交一周以内，折扣系数为0.8，迟交超过一周，折扣系数为0.6，超过一个月停止接收提交，尚未提交者本次作业计0分