纯文科出身、编程零基础的 Coli 刚开始转码硕士生活没多久,已经苦不堪言:
数学统计基础远远不够
别人已经在盖楼,我却连地基都搭不好。R 语言里单拎一个 function 出来,我都不知道是啥!
需要在短时间内速成多种 编程语言
同学大部分都具有相关本科背景,甚至已经有较高的水准。而我因为缺乏基础,需要短时间内快速掌握 Python、R 语言、SQL、AI 等知识,甚至还要掌握 JavaScript 和 html 这些……
拼命想跟上大家的进度,却依然很吃力
老师会默认很多知识点大家都已了解,因此上课的进度非常快。即便我在课前课后花了很多的时间预习和复习,这些东西依然在我脑子里糊成一团!
真的太痛苦了,感觉上课就是听天书,时刻担心自己能不能毕业,并且彻底打消了毕业从事代码工作的想法!
其实,并不只有 Coli 一个人遇到这样的困境。
在幸存者偏差的作用下,我们总是看到转码成功人士的励志故事。 但在转码的大热潮之下,很多不了解、甚至不喜欢、不擅长这个方向的人,也选择跨领域去学习 Computer Science、Data Science、Business Analytics 等专业。
且不说纯文科背景在数理基础上就遭遇难题,生化环材想要转码也同样存在巨大的跨度。
包装一下经历和文书拿到了 offer,读起来吃力 ,真是谁难受谁知道_(:з」∠)_
Business Analytics
(偏 Business 类,通常开在商学院下)
常见分支:
Customer Analytics, Healthcare Analytics, Supply Chain Analytics, Financial Technology Analytics, Marketing Analytics
参考院校 : UT Austin , Rochester, MSU, GWU
BA 专业核心是数据挖掘和数据分析 ,与现在的互联网及大数据( Big Data )相联合,主要是利用高深的技术、模型和算法进行数据挖掘和商业分析。
主要是由 MS in Statistics 下的 Applied Statistics 分支发展进化而来 ,其理论基础是统计学,也包含了 Data Mining 和 Regression Model 的运用。
总课时数大约 12-16 门课 。
1-2 门 leadership/project management,还有 7-8 门是数据分析相关的核心课:
• 一门结合编程语言的统计课
会涉及 Python、R、SAS 三种语言中的一或两种。
• 提供一门入门的编程课
为背景不够强的学生开设。
• Database Management
主要用到的语言是 SQL,有些学校也学 MS Access,学习数据录入、抓取、filter、排版、获取均值最大值。
• Data Mining
在统计和编程语言学习之后,针对不同的数据类型分类、预测(这是两种最常见的分析手段)。两种分析手段下有不同的模型,结合不同的数据应用不同的模型。
• 机器学习/高级数据挖掘
基于数据挖掘,但是学到的模型更加复杂一些。针对的数据多样性更多,数据量更大,数据本身的计算方式更加复杂,对数据要求更高。
• 时间序列
内容包括 Arima,预测时间序列,应用在金融、天气气候的数据。
• 更高级、predictive 的 model
时间序列中有 distribution,结合 data mining,有专门的 predictive analytics 的课程。
• Optimization 模型的最优化
涉及随机过程,包括 Stochastic Process。Optimization 中有不同的方式,不同的模型有 ES 不同的最优解。
统计学相关先修课:
Calculus I and II
Linear Algebra
Statistics
Probability
Econometric
Tools:
SAS, Stata, MatLab, R, S-Plus, Mathematica. Python, etc.
学校希望你 具有一定编程基础,会用一些数据处理软件 ,但相对 CS 或 DS 来说要求是低的,不必熟练掌 握 programming;甚至很多学校的 BA 项目十分包容,即便没有编程或数据处理软件的相关知识, 让学校看到你的学习能力也是可以的。
Business Analytics
(偏 Tech 类,通常开在工程学院或信息学院下)
常见分支:
Analytics on the Cloud, Algorithms and Data Analysis, Systems Analysis and Design, Machine Learning
参考院校: Northwestern(工程学院),CMU(信息学院)
设置在工程学院或信息学院下的 BA 项目相对偏 tech,更贴近 Data Science 方向, 对数学背景和计算机背景要求都很高。
BA 项目的核心课程大同小异,但选修课却各具特色:BA 是跨学科的专业,师资来源于不同部门,因此 选修课往往依赖于商学院或者学校本身的强势学科。
例如 CMU 的 CS 方向很强,选修课就主要以 CS 和 Stat 为主,例如 neuro network, natural language processing, Information Security ,侧重在 analytics 和 tech,更有技术含量。
除了前文提到过的统计学背景和基础数据处理能力, 最好也要掌握 Computational Programming 方面的内容:C/C++, Java 等。
投行、四大、咨询、科技公司 等。回国发展的毕业生发展更加多样化, 可以去技术岗,也可以做咨询或市场,去 VC / PE 的也不少。
热门职位:
1. 金融:可以成为前台 model tester 或者后台 risk control;
2. 咨询:非常典型的就业方向解决不同行业的问题,着重 problem solving 的能力,翻译成数据能够解决的问题,反馈给客户;
3. 市场营销和市场分析:比如淘宝用户数据分析;
4. IT,互联网:网站维护,用户浏览等 hidden insight 数据。
Data Science
数据科学主要是 学习一些成熟的数据分析方法和工具,学习跟数据分析相关的编程技
术 ,在工作中帮企业分析商业数据、市场数据、运营数据,或者帮金融机构分析金融数据, 做投资决策等。
主要研究内容分以下 三类 :
1. 描述性分析(Descriptive Analytics) :分析数据找出过去事件的特征和正在发生事件的 趋势。
2. 预测性分析(Predictive Analytics) :分析数据来预测未来可能发生的事情。
3. 决策建议性分析(Prescriptive Analytics) :分析数据来找出最佳措施、取得最优化的结 果。
大部分 Data Science 项目都 设置在 Engineering 学院下或独立成院 ,相比于 BA 更像一个完整独立的学科, 集统计学、数据分析、机器学习等学科为一体 ,并且正在迅速发展形成体系。
以哥大的 DS 项目为例,必修课程如下:
• STAT W4203 PROBABILITY THEORY
• CSOR W4246 ALGORITHMS FOR DATA SCIENCE
• STAT W5703 STATISTICAL INFERENCE AND MODELING
• COMS W4121 COMPUTER SYSTEMS FOR DATA SCIENCE
• COMS W4776 MACHINE LEARNING FOR DATA SCIENCE
• STAT W4701 EXPLORATORY DATA ANALYSIS AND VISUALIZATION
• ENGI E4800 DATA SCIENCE CAPSTONE AND ETHICS
涉及方向:algorithms, machine learning, computer systems 等
如果没有编程基础,读起来会很吃力 ;但相较于传统的 CS 专业,DS 对于编程的要求没有那么高,主要差别在代码量以及对系统的理解。
数据科学一般编的程序不会太长,很少有那种一个模块几万行代码的项目,一般都可以划分为比较清晰的小功能模块,很多时候几百行代码就可以干很多事情,而且不涉及到底层操作系统、文件系统、服务器这个层面的编程。 对于擅长数学和逻辑的跨申党,还是比较友好的。
而且,在数据科学领域,大家比拼的一般不是谁的程序运行效率更高,而是谁能提出更好的利用数据解决问题的方案,因此程序本身的实现一般不是重点。
这些专业的申请者更有优势:
Computer Science/Technology, Information Systems, Engineering, Math, Statistics, Economics, Business Management, Finance , etc.
先修课:
① 计算机课程和技能 :计算机导论, SQL , Database, Programming, C/C++等;
② 数学背景 :微积分, 数学建模 , 线性代数 ,概率论等。
③ 有的学校还有特殊要求 ,比如 西北大学 希望申请人上过 Java 课程等。
大多数项目倾向于录取 数学或者统计等计量学科背景 的学生,同时希望申请人有软件编 程基础、会写程序分析数据。 如果仅上过高数、线性代数、概率统计这三门理工科基础课程的话,那你的背景是不够的 (尽管有机会拿到录取)。
如果怀疑自己的能力是否足以应付课程, 强烈推荐你在国内的小象学院或国外的 Coursera、Udacity 等平台先修读一下 DS 方向的网课 ,亲身体验更有说服力。
制药业、计算机软件、互联网、科研、IT 技术服务、生物技术 ,都是对大数据专业人才需求最为旺盛的行业。
主要的职业方向有以下四种:
a. 数据科学家 (Data Scientist)
就业领域:云端大数据及企业大数据分析
岗位需求企业:数据分析研究所,亚马逊, IBM , 谷歌 , Cloudera , 微软 ,Facebook,Bloomberg等
b. 数据工程师(Data Engineer)
就业领域:云端大数据及企业大数据分析系统运营商、数据分析软件开发公司
岗位需求企业: 亚马逊 ,IBM,谷歌,Cloudera,微软,Cymer,Uber,3D systems 等
c. 数据分析师/ 统计师 (Data Analyst/Statistician)
就业领域:云端大数据及企业大数据分析
岗位需求企业:亚马逊,IBM,谷歌,Cloudera,微软,Cymer,Uber,3D systems 等
d. 商业/ 金融分析师 (Business/Financial Analyst)
就业领域:企业商业、金融大数据分析
岗位需求企业:亚马逊,IBM, 戴尔 ,四大,微软,Cymer,Lytx, Insurance ,Uber, 沃尔玛 等
Computer Science
计算机涉及的领域非常广泛,其分支学科也是非常多。目前中国学生申请美国研究生主要方向有以下这些:
1. System Security, Information Security 系统,信息安全
2. Software Engineering 软件工程
3. Artificial Intelligence 人工智能
4. Computer Vision 计算机视觉
5. Machine Learning 机器学习
6. Database 数据库
7. Human Computer Interaction ( HCI )人机交互
8. Computer Network 计算机网络
9. Theoretical Computer Science 计算机理论
了解 LIST、ARRAY、TREE 等计算机基本知识,同时掌握一些基础入门课程,包括 数据结构,计算机组成原理,C++/Java 等。在此基础上可以根据自己的能力和情况补充其它的相关课程,比如 networks, operating systems, database, Software Engineering 等。
CS 专业就业方向较为广泛,例如进入 IT 行业担任 软件开发工程师 、数据库开发工程师、 算法工程师 等;金融等行业的 算法工程师、 分析师 等也是常见的选择;其他很多公司或机构都需要招收计算机背景的学生, 提供各种技术支持 。
不过,计算机任何方向毕业之后的最大出路 基本就是去写代码做软件开发 ,虽然工作的 title 可能各有不同,但是工作性质都是类似的,基本属于殊途同归。
除此之外,具备计算机相关背景知识,可以一样去做 商业分析、管理信息系统、人工交互和数据科学 这类新兴方向。
总而言之, 转码这条路没有你想得那么光鲜,道阻且长。
你如果选择了这个方向,势必要比别人付出更多的努力、经历更艰辛的留学生活,未来更是要在这一领域长远地发展下去。
所以,别管父母、中介、朋友再怎么劝你“转码”,我建议你提前问问自己:
我是否真的喜欢需要写代码的工作?
是否真的喜欢每天和数据打交道?
是否真的对日复一日的建模和挖掘抱有热情?
希望你不要盲目跟风转码热,每一个决定都不后悔,因为——
做合适的选择,我们的努力才有价值。
如果你:
依然坚定且明确想转码
想了解哪些项目最适合我? 如何充分准备?
or
打消了转码想法
想知道还有什么方向,发展前景一片光明?
更多内容
请关注微信公众号 “棕榈大道”