课题简介
唐诗的大数据分析及自动创作
Analysis and Automatic Composition of Tang Poetry
自然语言是构建人类文明和智慧的基石,具有高度抽象和上下文丰富的特点。如何让计算机理解、加工乃至创作自然语言,是实现人机自然交互这一愿景的关键,也是人工智能领域的下一个增长点。过去,自然语言处理主要关注理解文本,例如辅助学者分析著作《红楼梦》的作者身份。如今,自然语言处理已经开始在文学创作中崭露头角,例如微软小冰聊天机器人通过快速学习近现代几百位中国现代诗人的作品,于今年5月份出版了原创现代诗集《阳光失了玻璃窗》,这是人类历史上第一部100%由人工智能创造的诗集。人工智能技术与人类文艺创作的关系将产生深刻变革。
本课题旨在探索自然语言处理技术在古典诗词创作中的潜力,通过对《全唐诗》中的海量诗篇内容进行大数据分析,运用计算机和数学模型探究唐诗和代表性诗人的创作风格和规律,并应用机器学习方法自动鉴别特定风格和流派的诗篇,最终构建生成唐诗风格和特定诗人风格的智能程序,甚至还可根据用户给定的开头续写诗句。
欢迎有兴趣的同学前来了解详情!