新闻中心

新闻中心

您现在的位置:首页 > 新闻中心 > 新闻中心

新闻中心

公共管理学院2018UIP全英语国际课程系列报道——美国雪城大学Bei Yu开设“Introduction to Data Science and Big Data Analytics”课程

发布时间:2018-07-24

2018年7月16日,在同学们热切的期望下,雪城大学Bei Yu副教授为我院2018国际课程周开设的“Introduction to Data Science and Big Data Analytics”课程正式开始。

此次课程总共为期四天,旨在教授同学们大数据分析基础,引导同学思考、讨论和分享自己感兴趣的学术或社会问题,鼓励同学用所学的分类、聚类等方法尝试解决这些问题。除了选课的同学,课程的前沿性和实用性还吸引了灾后重建学院的老师前来参加。

 

课程伊始,Yu老师主要围绕数据生命周期、数据管理与分析中的几个重要问题,结合实例讲述了数据科学的理论基础和基本方法。并让同学们谈论大数据和算法对自己的影响。

Yu老师的教学注重理论、案例与实践相结合。接下来的课程中,Yu老师循序渐进,深入浅出地介绍了分类、聚类相关知识。理论方面,Yu老师介绍了几种流行算法,分别是决策树(Decision tree)、朴素贝叶斯(naïve Bayes)K近邻算法(K-nearest neighbors)、支持向量机(SVMs)K均值(K-means)。期间还提及了分词、反向文档词频、余弦相似度等知识。案例方面,Yu老师在课堂上讲了许多有趣的案例,比如,预测泰坦尼克号船员的生存率;分析员工和上司之间写邮件,谁用“I”更多,谁用“We”更多;统计动物园中各种动物的特征,比如是否有毛发、是否产卵、是否水生等,分析动物的名称和类别等。实践方面,Yu老师充分利用了智慧教室的屏幕广播、学生演示等功能,使用工具Weka、Anaconda,为学生演示了如何通过训练集建立决策树、分类、聚类模型,再用测试集分析结果。

 

在课堂上,Yu老师十分注重锻炼同学们的动手能力。在她的指导下,同学们学习Weka的决策树功能,通过作者日常用语习惯的统计,来判断有作者争议的论文的真正作者;利用Weka的分类功能或者Python的Pandas库,使用多项式朴素贝叶斯算法建立模型,对客户评论进行情感和真假分类,并对比情感分类和真假识别的难易程度;利用Weka的聚类功能,对第一次关于大数据和算法对自己影响的文本,分析同一个小组的回答是否更相似。

 

课程进行期间,Yu老师经常与同学们进行互动,鼓励同学们表达自己的想法。在最后一堂课上,Yu老师让同学们用Project Proposal的方式,以小组为单位,根据在本课程中学到的知识,提出一个可以使用数据分析方法解决实际问题的项目构想,进行汇报和展示。同学们分别将自身所学用在运动、法律、健康等领域问题的思考上,提出了非常独到的见解。

 

课程结束时,同学们纷纷与Yu老师合影,向Yu老师表达最真挚的感谢与不舍。课后曾怡同学表示,自己非常喜欢Yu老师的授课方式,感受到了老师面对数据的好奇心与批判性思维,对数据的“玩法”有了全新的认识。郭亚琪同学表示,这次课程不仅学习了知识,还拓宽了视野,Yu老师为同学们带来了一次非常享受的大数据课程体验。周礼泉同学则表示,自己将在以后的学习中,牢记老师所说的保持一颗好奇而严谨的心,去探索,更希望以后能有机会参与更多这样的课程。

 

 

来源:学院国际合作与交流办公室

撰稿:郭露

摄影:郭露/冉荣

审稿:范炜/吴菁

领导邮箱

书记信箱地址:spascu@163.com

院长信箱地址:ggglscu@163.com

提示:请将您的宝贵意见或建议用常用邮箱发送。

川大公共管理学院二维码

川大公共管理学院 (scu-ggglxy)

提示:扫描二维码关注四川大学公共管理学院官方微信公众号