博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《数据科学家访谈录》总结·2
阅读量:5972 次
发布时间:2019-06-19

本文共 1824 字,大约阅读时间需要 6 分钟。


06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen


  1. Clare Corthell
    “开源数据科学高手”课程创建者
    教育经历:斯坦福大学·学士
    职业经历:Mattermark数据主管
img_3f07de78fd10abe1a93f35fbe925eda7.png
  • 与众不同之处

在斯坦福的专业是科学技术与社会学,完全是靠自学掌握了数据科学。是一个主动学习能力非常强,很有恒心的人。

  • “开源数据科学高手”地址(注:好资料!)

  • 推荐《集体智慧编程》一书

“每一次我打开它的时候,总有一些新的知识会跳出来,并且我也越来越理解有关整合用户想法的东西。那本书成了我的基石,我用它来衡量我取得的进步。它绝对是数据科学家的“圣经”。”

  1. Drew Conway
    《Machine Learning for Hackers》共同作者
    数据科学韦恩图创建者
    教育经历:计算机科学与政治科学双学位,纽约大学政治学博士
    职业经历:IA Ventures,Project Florida数据主管
img_57f95f5f61b13d247e10664818d1b510.png
  • 数据科学韦恩图
img_1be4515fbeaf2f08fd5eef6797e357be.png
  • 为什么要读博士?

遇到了职业天花板。在纽约读博期间创建了data kind,并与Mike Dewar和Hilary Mason结识。

  • 讲故事的能力

“其实大部分数据科学家所做工作中的一大部分都不是数据整理或者建模或者编程,而是一旦你做出了一个结果,你必须要想办法将结果解读给那些完全不具备看懂这个图所必需的技能的人听,例如那些做商业决定或者工程决策的重要人物。”

  • 比较纽约和硅谷

纽约资源配置更加集中。

  • 选择Python还是R?

“他们想要学习Python或者R但是不确定哪一个更好,我告诉他们不要犹豫,直接选一个深深地扎下去就行。”(注:我觉得还是Python生态好)

  1. Kevin Novak
    教育经历:密歇根州立大学核物理博士,研究方向回旋加速器,主要工作是用统计方法去对核交互作用中的理论模型建模,然后用加速器里跑出来的数据来验证模型是否正确。
    职业经历:Uber数据科学主管
img_544f60524cbad6dd86622f1819310437.png
  • Uber数据团队构成

Uber数据团队中的每个人几乎都是来自非传统的行业背景的。他们过往差不多都在做各自不同的东西。

  • 数据科学包括什么?

其中一个概念就是“大数据”,海量的数据经过处理分析被提取出数学化的结论。另一个概念就是高度专业化的预测建模。

  • 数据科学必备技能

数学、统计学、计算机科学。

  • 数据科学的前景

传统的数据领头羊公司专注还是社交数据,Uber用于解决物流问题的方法也可以推广到一切统筹问题。其它的还包括,分析基因组、健康领域。

  1. Chris Moody
    教育背景:加州理工学士,本科物理学;加州大学圣克鲁斯分校博士,研究方向计算天文学(注:Chris从本科开始就与天文学打交道)。
    职业经历:Square,Stitch Fix。
img_ffa83c13b25caf5fcbb83fa7d8dc48da.png
  • 自学

“我的一大部分软件工程技术,甚至于整个计算机科学知识,都是完全自学的。我没有上过任何那个领域的正式课程。”

  • 数据科学意味着什么?

“总体上来说,它意味着你对数据进行计算的方式,能够有能力对数据进行解读,对数据进行建模,并且最重要的就是,有能力用数据的内在意义去与别人沟通交流。”

数据科学大概可以分为两个板块:描述分析和预测分析。预测分析型数据科学家需要一些有关于机器学习的知识,而描述型的数据科学家应该需要一些统计学知识。

  • 相比于优秀的数据科学家,卓越的数据科学家具有怎样的素养?

“我觉得可能是沟通交流方面的技巧。你必须要有能力去将你做的东西讲出来给别人听。”

“编程能力不会是最重要的能力。”

  1. Erich Owen
    教育经历:Albion文科学校学士·数学物理(注:原书这里翻译成立自由艺术学校,囧),布朗大学硕士·应用数学
    职业经历:Quid、Newsle、Facebook
img_5653dadcd57926a34e0b279c322e031d.png
  • 大学时代最应该做的事

去做实实在在的东西,建立网站或者完成一些项目,写更多的程序。

  • 在Facebook的工作

主要工作是搭建全栈系统,也做机器学习。

  • 相较于一般的数据科学家,是什么品质让那些卓越的数据科学家得以脱颖而出?

扎实的编程基本功和系统的思维能力是最为重要的。

  • 数学的作用

举例,低通路的过滤器去过滤这一批数据,“数模转换”概念对于研究社交数据的作用;奇异值分解;随机映射。

  • 关于学习

“我觉得根据我多年的本科和研究生经历,我做的最为有用的事情就是我一直在不断地在学习,并且我是为了求知而学习,因为我真的对于学习很有兴趣。”

转载地址:http://rszox.baihongyu.com/

你可能感兴趣的文章
mac系统下git、mysql、nginx、php的环境搭建
查看>>
JavaScript面向对象编程——Array类型
查看>>
让IE兼容background-size的方法_background-size ie下使用
查看>>
中国发布自主开发的域名系统基础软件 “红枫”
查看>>
优秀程序员必须知道的32个算法,提高你的开发效率
查看>>
在WPF中实现平滑滚动
查看>>
java并发编程实践 part 01 --> 线程创建方式
查看>>
PHP查看PECL模块包含的函数
查看>>
dedecms上传图片不自动改名,以利于seo图片优化
查看>>
Java新手小程序之三
查看>>
我的友情链接
查看>>
Spring Web Application Security
查看>>
grant&revoke
查看>>
leveldb demo
查看>>
VMware网络配置详解
查看>>
再学 GDI+[83]: TGPImage(3) - 平行四边形变换
查看>>
Linux vmstat命令实战详解
查看>>
我的友情链接
查看>>
数据库中的自连接
查看>>
mysqlimport
查看>>