《大数据分布式计算》课程实验案例——利用大数据分布式计算从海量文本数据中发掘新闻情绪与股票收益的关联
案例简介:《大数据分布式计算》课程采用的是以大数据实验案例贯穿的教学模式,目的是培养学生利用大数据分布式计算工具以及平台独立收集、整理、分析海量数据,并得出有益价值的能力。对于每个案例我们要求案例有切实实际意义,数据来源独立且有一定规模,能够充分利用大数据分布式工具的优势。“利用大数据分布式计算从海量文本数据中发掘新闻情绪与股票收益的关联”实验案例是《大数据分布式计算》课程开设四年来我们所撰写多个开放性的选题案例的一个典型代表。 本案例利用大数据分布式技术探寻新闻情绪对股票市场波动的影响。探究新闻情绪和股票收益的相关性结构可以更准确地预测股票市场运动从而构建合理的投资策略获得收益。本文应用了大数据分布式计算方法,从互联网获取487家在美国上市的中国公司的股票日收益数据以及总量约130万条新闻文本全文,来探究新闻情绪和股票收益之间的相关性。分析不同情绪的新闻文本数量和股票收益的相依结构和尾部相关性。本案例实验结果显示,正面和负面新闻情绪均和股票收益存在相关性,这对研究在美国上市的中国公司的新闻对股票波动预测有很大帮助。
案例作者:李丰
所属单位:中央财经大学
发布时间:2017-12-21
所属奖项:经济组二等奖
财经高校精英汇公众号
    联系我们
  • 北京市海淀区阜成路甲28号新知大厦
  • 010-8819 1605
  • service@e-courses.cn
案例大赛QQ群二维码
  • 京ICP备17041490号-1  京公网安备 11010802027141号
  • ©2018 国家级实验教学示范中心联席会经济管理学科组  版权所有
  • 北京百智享科技有限公司  技术支持