讲座_视频_概述:应用深度学习最终项目

时间:2021-02-28 11:51:52
【文件属性】:
文件名称:讲座_视频_概述:应用深度学习最终项目
文件大小:154KB
文件格式:ZIP
更新时间:2021-02-28 11:51:52
JupyterNotebook 讲座视频总结 该代码被用作我在2020年秋季在哥伦比亚大学进行的应用深度学习课程(COMS 4995)的最终项目。该代码分为4部分。 预处理:这用于将我的课程成绩单存储库转换为唯一的结构化数据集。 我希望将其以csv的形式存储,以便易于阅读和编辑。 基于单词嵌入的基本摘要:此代码用于构建基线模型,该基线模型计算每个文档的文档嵌入,并选择与整个文档嵌入的余弦相似度最高的3个句子作为摘要。 句子嵌入是通过对单词嵌入词进行平均来计算的,并将文档嵌入作为文档中所有句子嵌入的平均值。 BERT的提取摘要:此代码使用经过微调的BERT嵌入来实现双向上下文嵌入。 默认情况下,BERT为序列中的每个单词提供句子嵌入以及上下文单词嵌入。 因此,使用句子嵌入,我计算了句子中的2-3个群集(可以对群集进行实验(我将我安放在3个群集上,每个群集取1个句子),并计算群集的质心。 然后,我发现了最接近聚类的句子
【文件预览】:
Lecture_Video_Summarization-main
----BERT_Extractive_Summarization_Centroid_Method.ipynb(147KB)
----Abstractive_Summarization_with_HuggingFace.ipynb(120KB)
----Using_GloVe_Embeddings_For_Summarization.ipynb(192KB)
----README.md(2KB)
----Final_Project_Preprocessing.ipynb(35KB)

网友评论