注册 登录
查看: 2188|回复: 0
打印 上一主题 下一主题

《数据分析、展现与R语言》课程[价值400元]

[复制链接]

该用户从未签到

3524

主题

3538

帖子

67万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
673178
QQ
跳转到指定楼层
楼主
发表于 2017-11-13 10:40:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

2011年统计的数据分析软件使用率情况,R语言多项雄踞首位,是最热门的分析利器


近年来,由于存储设备的单位成本以惊人的速度下降(1G硬盘空间的成本现在只需要几美分,这在过去难以想象),我们可以轻而易举地积累起大量的数据。电信 运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一 次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在产生海量的视频数 据。在生命科学领域,对人体的DNA分析,一个个体就能产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数据,信息量将会是怎样一个 规模,如此等等,不胜枚举。我们毫无疑问,正处于一个信息爆炸的时代。


很不幸的是,我们得到了大量的数据,而这些数据中的绝大部分,在它的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备 查”。尽管“啤酒与尿布”的故事,已经写入教科书有10多年了,几乎每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的 处理依然停留在按预定指标进行统计这种很低的水平上。造成这种情况的原因有很多。一方面,由于业务人员和IT人员的工作鸿沟,使到即使能提出数据分析的需 求都成了一个很大的困难。在各公司里保管数据的大多是IT人员,他们对业务的了解可能并非很深入,而业务人员也鲜有对数据有深入认识者,他们通常都缺乏必 要的数学素质和知识基础去进行建模和深入的分析工作。另一方面,数据分析专家具有深厚的数学处理能力,善于建模和构筑算法,但是由于无法得到合适的需求, 他们的能力也无从施展。另外数学家、统计学家们很多并不熟悉现代的IT软硬件设备的特性,对于集群、分布式系统、大规模存储、云计算、数据库等认识几乎为 零,对于算法的实现可能还停留在对着PC写C语言程序的水平上,对于海量数据,无法利用现代化设备的能力,使到算法是否能真正实现变成生产力存有很大的疑 问。

现在这门《数据分析系列网络课程》正是要打破这种鸿沟。用新兴的互联网教育模式,把各应用领域的业务专家、数据分析专家、IT专家推荐给学习者,向有志于 学习数据分析知识发挥数据价值的朋友能得到低成本交流的机会。我们的目标是在中国传播“技术成就梦想,数据产生价值”的观念,使学习者能快速提升其个人能 力,在新的挑战面前获取更多个人机会,企业能在保存的海量数据中炼出黄金。

R是一套完整的数据处理、计算和制图软件系统。是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使 用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R既是功能强大的 统计和分析软件,同时也是完美的数据可视化制作工具,丰富的图形函数和外置包,几乎无限的扩展能力,使到我们的想象空间永远都不会达到上限


《数据分析、展现与R语言》课程介绍如下:

课程内容:
1 基础数据分析知识,包括一些概率统计里的概念、术语,和基本统计量的计算方法等。
2 一些常用的数据分析和数据挖掘算法,以及有关的各种领域里的实际应用案例分析
3 世界最流行的开源数据分析软件R及其编程方法
4 数据展现,介绍R及其强大的图表功能

第1周  R语言基础:R简介,变量,向量,数组,矩阵,数据框,读写文件,控制流
第2周  R语言基础:R的数据可视化,各种图表,常用统计量计算
第3周  预知未来的回归模型:随机变量,密度函数,一元线性回归模型
第4周  预知未来的回归模型:多元线性回归模型
第5周  数据展现:基本制图函数综述
第6周  预知未来的回归模型:logistic回归,广义线性回归,非线性回归
第7周  数据展现:理解关键制图参数
第8周  挖掘关联和推荐技术:MINE方法,apriori购物篮分析
第9周  数据展现:散点图
第10周  万事皆选择:分类算法,线性判别法,贝叶斯分类器,决策树,最近邻算法
第11周  数据展现:线图与时间序列谱图
第12周  数据展现:柱形图,点图,饼图,直方图
第13周  万事皆选择:聚类算法,层次聚类法,谱系图,k平均值法,k中心法
第14周  数据展现:箱线图,热力图,等高线,地图,转换为图形文件
第15周  大道至简:降维技术,主成分分析和因子分析

本课程糅合了之前所开的《数据分析与R语言》《R语言进阶——数据展现》两门课的精华,去除部分较为艰涩的内容,增加更具有实战价值的知识,是过往有关课程的升级改进版。在进度上,把较难掌握的算法和建模部分与相对较为容易的数据展现部分相间,使到学习者有更多的时间去理解吸收建模知识,这也是通过过往课程得出来的经验,有望可以达到更好的学习效果。

授课对象:
这是一门数学+IT的课程,适合已经有一定的IT基础,但对数据分析行业尚不了解的朋友进修学习。

授课时间:
第13期课程预计2014年10月28日开课

授课讲师:
tigerfish,ITPUB创始人,中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。他将带领他的数据分析团队完成整个授课工作。

学习收获预期:
算法有一定的了解,有一定的使用R语言解决问题的能力,并且熟练地使用R做出精美的图表


百度网盘下载地址:
游客,本付费内容需要支付 10金币 才能浏览支付

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
java无忧网(http://www.javawyw.com),专业提供Java大作业,小作业,课程设计,毕业设计源码,答辩辅导,作业排错,bug修复,专业解答,远程部署运行项目等服务
本网站所有源码,保证能运行!
QQ:1399491757
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回列表 返回顶部