数据科学及分析(数据科学数据分析)
数据时代,企业对数据人才的需求越来越大,从而催生了一门研究如何挖掘、处理和分析数据的专业学科——数据科学(DS)。
数据科学(DS)
DS是一门侧重于计算机、统计学、数学等学科以及数据综合应用的新兴学科。适合本科阶段学习计算机、数学、统计学、工程等理工科专业的学生申请。
目前DS专业主要以硕士项目为主,博士项目很少。DS本身更偏向于职业导向,因此有兴趣走学术研究道路并有志于未来攻读博士学位的同学建议继续深造统计学、数学等专业。
如果想成为一名合格的DS人才,除了懂得如何获取数据、数据维护、数据处理与分析之外,还需要懂得如何将从数据中获得的价值传递给他人。
01申请要求
基本先修课程要求:
数学(微积分、线性代数)统计(统计学、概率)计算机(至少一门编程语言)由于每个学校的要求不同,所以最好尽早了解你的目标学校项目,以保证你的本科水平。该课程不仅满足学校的毕业要求,而且满足研究生课程的先决条件要求。
申请就业型硕士项目时,除了满足基本的先修课程要求外,还需要考虑申请人的职业规划和实践经验。因此,通过项目、实习等应用经历来体现专业能力也很重要。
哪些实践经验符合申请要求?通常我们需要考虑以下几点:项目难度、项目匹配性、工作相关性、个人参与度。
无论是项目还是实习,对于掌握相关知识和技能都有一定的要求。要做数据科学相关的实践,需要具备熟练的编程能力,了解机器学习相关的算法,才能更好地应用到实际问题中。
02职业方向
随着互联网的快速发展,数据可以用于科学研究、商业管理、金融活动、政府管理以及几乎所有其他相关人类活动的分析。
据中国数据分析学习网统计,数字分析最大的就业方向是IT/互联网/通信行业,其次是金融/银行/保险行业。随着大数据的蓬勃发展,各行各业都呈现出数字化转型的需求和趋势,更多行业及其细分领域对数据分析师职位的需求也在不断增加。
DS硕士项目最大的优势就是课程设置。您将在硕士学位期间学习软件系统、机器学习、数据库、优化、决策科学、统计学、商业智能等所涉及的所有领域的一些知识。
因此,DS专业的毕业生除了考虑商业分析工作外,还可以选择技术性更强的工作,比如数据科学家、机器学习工程师等:
03项目推荐
总体来说,申请美国DS专业还是比较困难的。一方面,它很受欢迎。另一方面,很多项目是申请要求较高的顶尖学校提供的,而中等水平学校相对较少。
DS专业申请者除了准备GPA和GRE考试外,最推荐的实习就是数据公司的数据岗位,可以直接锻炼和展示自己的数据分析能力。
此外,你还可以选择一些统计、定量相关或计算机相关的实习来培养和提高你的定量分析和编程能力。
大学优质DS项目排名前10名
1.斯坦福大学
斯坦福大学实际上有两个DS项目,一个在ICME(计算与数学工程研究所),一个在统计系。它们都属于数据科学类别。整体课程差距不大,但申请难度不同。
ICME-DS
该项目对申请者的数学背景要求非常高,要求具备线性代数、数值方法、概率、随机性、统计理论以及熟练掌握C和R编程。这些课程的课程成绩也很重要,基本要求是3.9+。
主要招收数学/统计学/计算机专业的学生,同时也看重DS相关的科研经历。应届生都可以申请,中国学生也不少,但更喜欢美国/海南的顶尖学生。
MS统计-DS
斯坦福统计系的MSstats和MSstats-datascience也需要单独的申请。MSstats-ds轨道是一个终端学位,无论文,5个季度长。
请注意,申请时只接受托福,不接受雅思。平均标准化分数为Verbal97%+Quantitative97%+Analyticalwriting82%;TOEFL:平均分110总计。必修课程需要线生成、统计/概率论、随机过程、数值方法、编程(python/C/C++)等;没有采访。
2.卡内基梅隆大学
计算数据科学硕士
CMUMCDS计算数据科学项目隶属于CMUSCS计算机科学学院,也是一级神级项目。以就业为导向,可以选择1.5至2年毕业。这个项目的前身实际上是VeryLargeInformationSystems(2004)中的MSIT,所以它并不是特别专门针对DS,它更多的是CS。
课程体系比较成熟。第一学期有四门DS基础课程。第二学期可以选择三个方向之一:系统方向(专注于数据库、分布式算法和存储)、Analytics分析方向(最前沿的DS,专注于ML/NLP等)和Human-以DS为中心的方向(DS的跨学科应用)
申请方面,项目规模超过60个,录取率3%-5%,中国学生比例较高,基本有CS/Math背景。GPA3.8+,更注重学生的科研经历。除了硬件指标外,中国大陆录取的申请者一般都有在美国暑期研究的经历。
3.宾夕法尼亚大学
数据科学MSE
宾夕法尼亚大学的数据科学硕士课程共有10门课程,持续时间为一年半或两年。课程涵盖2门基础课程、3门核心课程和5门技术深度领域选修课程。
基于宾夕法尼亚工程学院的优势,该课程不仅融合了DS的核心知识,还涵盖了机器学习、大数据分析、统计学等,更重要的是,选课自由度很大,选修课也很丰富。提供的课程涵盖广泛的DS应用领域。这就够了。DS项目的课程相当全面。
另外,众所周知,宾大的工作量是非常大的!大家在申请前还是需要做好心理准备的。但如果你对科学研究感兴趣并且成绩不错,入学后你将有机会和导师一起做理论/实习(但你确实需要是一名高水平的学生)。
从申请来看,历年的录取率只有10%左右。具体数据来看,21fall申请1984人,录取195人,录取74人;20秋季,1525份申请中,有190人被录取,最终只有47人被录取。
宾夕法尼亚大学工程学院的录取特色就是非常重视GPA!几乎总是3.8+/3.9+。GRE22fall是可选的,但是参考FAQ平均分(VerbalReasoning158+QuantitativeReasoning167+Analyticalwriting4),你就会知道用这样的G来申请是最好的。
4.纽约大学
数据科学硕士
该项目隶属于纽约大学数据科学中心CDS。CDS是美国第一所提供DS博士和本科课程的学院。可以说是DS领域的标杆。依托NYUCourant在数学和计算机科学领域的优势,CDS的师资和学术资源不言而喻,同时也拥有纽约天然的地理优势。
该课程通常需要两年才能毕业。课程非常齐全,完全按照数据科学家的职业方向进行培训。它既包括数学/统计学、计算机/ML算法等基础课程和硬核课程,也有细分赛道的选项。
NYU的NLP很强,还有跨学科的数据科学物理/数据科学生物学/数据科学生物学。需要注意的是,该项目也有兼职,所以有夜校。如果是就业导向的话,还提供行业集中度,包括cpt。
如果申请的话,是一级项目,规模也不会太小(150个左右)。大多数人有数学/计算机背景,但其他专业背景也可以,包括商科/物理/生物/工程等。中国学生相当多,来自美国的比来自中国大陆的多,而且都是拥有高水平三维课程;有特定的先修课程要求。
5.哥伦比亚大学
数据科学硕士
除了跨学科科目,哥伦比亚还有正式的DS项目!
哥伦比亚大学的数据科学(DS)项目设立在自己的专门学院(数据科学研究所)下,由文理研究生院统计系、应用科学学院计算机科学系和工业工程和运筹学系。该项目学制为1.5年,共3个学期,要求课程30学分。
课程领域主要为计算机科学、工程和统计学,核心课程包括数据科学机器学习、概率与统计、统计推理与建模等。课程整体安排非常合理,不仅可以帮助学力不足的学生弥补了自身编程基础的不足,同时也提高了学生在DS方面的知识水平。选修课也涵盖了很多数据相关的领域,而且由于项目与计算机学院有重叠,所以DS学院的很多老师也是CS专业的老师。相应的,DS项目课程的编码训练内容也远高于哥伦比亚大学其他同类数据专业。项目规模比较大,100+,中国人占大多数,印度人次之,所以热门课程和求职资源分配非常紧张。因此,哥伦比亚DS毕业生找工作并不容易。建议申请时本科生有良好的统计/编程课程背景。3.7+/325+/105+的标准分数只是必要而非充分条件。哥伦比亚大学也比较注重名牌本科院校的背景。中国大陆大学基本都是中档985或专业较强的院校(如北京邮电大学)。除了上面这些之外,还有耶鲁大学的统计学MA、CMU的MSinDataAnalyticsforScience、布朗大学的数据科学硕士等等,都非常不错!