当我们学习一些新的东西,比如编程语言时,我们从初学者开始。我们可以学习和遵守这些规则,并在狭隘的背景下应用它们。然而,我们不了解更大的图景,在特定的背景之外迷失了方向。
想象一下,我注册了R上的MOOC,学习了统计分析、机器学习和闪亮的仪表板。作为机器学习的一部分,我了解到我应该将数据分成训练集和测试集。我在作业和卡格尔中应用了这一点,一切都很好--这是狭义的背景。
然后,也许我有机会在更广泛的环境中应用我的新技能-我构建一个模型,验证它(通过随机的列车测试拆分),然后部署它。但是,离线和在线(即A/B测试)指标不匹配。最后,我想我应该使用基于时间的拆分,这样将来的数据就不会泄露到训练集。
得益于更广泛的背景,我遇到了不属于MOOC作业的挑战和失败(阅读:经验教训)。结果,我看到了更大的图景;我知道还有很多东西需要学习。因此,我通过初学者、中级等阶段继续学习和进步。
我学得越多,就越意识到我不知道的东西有多多。--阿尔伯特·爱因斯坦。
假设我在一家小部件制造商的人力资源部工作。从员工数量到工资总额到假期余额,一切都在Excel中运行。我应用我新学到的R技能,通过一次性脚本自动完成我的工作。这包括计算工厂现场的统计数据,并通过部门桌面上闪亮的仪表板显示它。在我的经理和团队眼中,我绝对是一个摇滚明星忍者巫师。我得到了铺天盖地的赞扬,并被提升为人力资源数据科学部的经理。
我可能不知道正确的ML验证、部署、单元测试,甚至版本控制。我当然没有做过任何那件事。但谁在乎呢?我们不需要它。我现在是人力资源数据科学部的经理。我现在是…。一个“专家”。
对那些知情的人来说,我显然还是个初学者。但我的背景很狭窄,我看不到更大的图景。所以我不知道还有很多东西要学,还有很多要做。然而,由于我取得了些许成功(通过对所学知识的狭隘应用),其他人称我为专家,我现在将自己视为专家。结果,我停止了学习。我现在被困在一家当地的最优酒店。我已经成为一名专业的初学者了。
假设我在人力资源部的同一个职位上呆了10年。最后,我是有10年的经验,还是一年的经验重复了10次?
作为人力资源数据科学部门的负责人,我聘请了一个数据科学家团队。最终,一些团队成员会建议新的技术(例如,Python、Docker)或实践(例如,版本控制、单元测试)。
然而,我是最有经验的(也就是任期最长的),也是最专业的专家。我摒弃我不熟悉的想法和技术。“哦,我看你是新来的。是的,Python听起来是个好主意,但首席人力资源官真的很喜欢我做的闪闪发光的仪表盘。“。“哈哈,我们不需要单元测试!我每天都在使用和呼吸这个代码--没有必要测试它。“。
能够看到大局的团队成员对过时的技术和不正确的实践感到失望。他们看不到学习和成长的空间。因此,最有才华和雄心壮志的人会离开(如果他们知道什么对自己最好的话)。对于那些留下来的人-万岁!竞争减少了。他们会循规蹈矩,有一天,他们会成为一名资深的专家初学者,并教新加入者他们的“专家”方法。
这就导致了死海效应,在那里你只剩下最没有才华和效率的人了。他们很感激有一份工作,并在那里安顿了几年(或几十年)。现在,团队已经发展成为一支遵循顶级专家初学者指导的专家初学者大军。
因为专家初学者已经学会了“一切”需要学习的东西,尝试了“一切”需要尝试的东西,做了“一切”需要做的事情,所以没有什么新的东西需要学习、尝试和做。团队不再尝试新的想法--“哦,我们这里不使用Docker。我们有虚拟机!“-该组织停止了创新。
这在一定程度上解释了一些行业被颠覆的原因。苹果手机颠覆了诺基亚和黑莓,亚马逊颠覆了内部硬件,条纹颠覆了支付处理,特斯拉颠覆了…。你懂的。
我们如何防止停滞(并有可能成为专家初学者)?我们怎样才能保持开放的心态,不断地学习和试验呢?
一种方法是Shoshin(初学者的想法)。这是禅宗的一种观念,即即使我们对这门学科的知识是先进的,也要有开放、渴望的态度,而不是先入为主的态度。换句话说,要像初学者一样思考。
在初学者的心目中有很多可能性,但在专家的心目中几乎没有。--铃木顺龙(Shunryu Suzuki)。
带着初学者的心态,不管你的经验和专业知识如何,作为一个学生,你会保持好奇心,并接近新的想法和经历。即使新的技术或方法不适合你的范例,你也愿意学习和尝试。学生们不会说“这不是我们这里做事的方式”。
有时,当别人认为我们是专家时,我们就让它影响了我们。我们停留在狭隘的主题专业知识范围内,停止探索新的想法和可能性。我们避免新的、更大的挑战,这样我们就不会犯错;我们坚持过去行之有效的做法。这有助于保持我们的专家身份。
语言中最危险的一句话是,“我们一直都是这样做的。”--格蕾丝·霍珀(Grace Hopper)。
但这说不通。在我的数据科学领域,新的工具(如Spark、Docker、Airflow)和方法(如嵌入、注意、预培训)不断改进最新技术(SOTA)--与时俱进即使不是必要的,也是有用的。(也就是说,回归和决策树等基本技术通常是可靠的基准。)。
学习就像骑自行车。当我们开始踏板(从静止状态)时,需要付出努力和时间才能获得动力。尽管如此,我们还是会加快速度,开始增加距离。
我们可能会回头看看我们开始的地方,然后想:“哇,我已经走了很长的路。也许我不用那么使劲地踩;也许我根本就不用踩。“。如果我们停止踩踏板,最初的动力可能会让我们稍微走得更远,但最终,我们会停滞不前。虽然我们没有失去覆盖的距离,但我们也没有增加距离。(尽管在科技这样的快节奏领域,如果你不前进,你就会开始倒退。)
在这里,距离是知识(和成就);动力是学习。虽然距离与专业知识相关,但这种关系并不像我们想象的那样牢固(例如,一年的经验重复10次)。我认为动力(快速学习和适应的能力)也是专业知识的一部分。我认识的专家经常在阅读或黑客攻击。在工作中,他们可以综合他们的心理原型,并根据上下文量身定做解决方案。
为了保持动力,初学者的思维继续踩踏板,不管他们走了多远。不足为奇的是,许多成功人士现在和将来都是如饥似渴的读者和学习者。沃伦·巴菲特、比尔·盖茨、埃隆·马斯克,仅举几例。你认识什么不读书不学习的成功人士吗?
21世纪的文盲不是不会读不会写的人,而是不会学、不会学、不会再学的人。--阿尔文·托夫勒。
我们从书本和课程中学到了一些知识--我们会在考试中测试这方面的知识。然后,我们从实践中获得了(默契的)知识--我们在生活中接受了这方面的考验。
你不能从这种自我传播的系统中获得教育,在这种系统中,人们学习是为了通过考试,教别人通过考试,但没有人知道任何事情。通过自己动手,通过提问,通过思考,通过实验,你可以学到一些东西。🧠。
-理查德·费曼(@Prof.Feynman)2020年8月17日。
例如,学习骑自行车。我们不能通过看课本来学骑自行车。学习的唯一方法就是身体力行。我们会失去平衡,跌倒,但最终,我们会弄清楚的。此外,我们骑自行车的能力也可以转移到其他两轮交通工具上。一旦我们学会了如何骑一辆普通的自行车,我们在山地自行车、双人自行车,甚至电动滑板车上的学习曲线就会变得更加平缓。
同样,有些技能和知识也只能通过实践才能获得。它们通常也可以跨多个域传输。例如,在生产中为模型提供服务最合适的方式是什么?有几种常见的模式:离线计算和缓存、微服务服务、嵌入到主应用中。这些模式在不同的域中是否有所不同?没什么。对于我们的用例,哪种方法是最好的?嗯,这要看情况--知道答案是默契。
通常,这样的技能和知识是基本的,可以被认为是基石(或基本原则)。例如,在编程中,我们学习了条件、迭代和数据结构。在分布式数据处理中,我们学习映射、缩减和改组。一旦我们理解了这些基础知识,选择另一种编程语言或分布式处理框架就更容易了。它还帮助我们编写更有效的软件和ETL工作。
掌握基础知识对元游戏也有帮助。元(即高阶因子)不断变化。例如,自然语言处理已经从递归模型到嵌入,再到关注预训练。
如果我们一直在关注,我们可能已经注意到来自计算机视觉的思想的交叉授粉(例如,迁移学习)。此外,无监督学习(例如word2vec、t5、gpt-3)带来的巨大改进表明数据为王。最后,随着模型变得更大以推动SOTA,我们看到了另一个元-更多的计算胜利(也就是痛苦的教训)。
如果你相信初学者的想法,这里有一些关于心态的建议:
保持谦虚。是的,我们应该为我们的成就感到自豪。但是我们永远不要认为我们的学习是完整的,或者我们是万无一失的。这就要求我们对自己有耐心,能够说“我不知道”,并且能够接受失败。
保持好奇心和开放的心态去尝试新的想法,即使它们与我们的先入之见不符。探索新的方法,而不是“我们一直是怎么做的”。
建造和修补。有些技能最好通过练习获得。在工作中,继续贡献代码(如果可以)。在工作之外,找时间尝试新的工具和技术。这使我们了解最新情况并了解细节。
广泛阅读。每周阅读一到三篇论文,做笔记,并与你的同龄人讨论。(无耻的插言:应用毫升和毫升调查都是很棒的收藏。)
与更广泛的社区接触。参加聚会和会议。它们帮助我们看到我们角色和组织之外的更大图景。每季度参加一次会议,每年参加一次会议。现在他们中的大多数人都在线了,这就更容易了。
如果你领导一个团队或组织,创造一种学习文化。鼓励你的团队阅读和讨论论文。给你的团队探索和失败的空间。庆祝A/B测试,因为它们帮助我们更多地了解客户-即使是那些,特别是那些没有成功的客户。鼓励外部学习(例如,公司红包、会议、会议)。招聘时,不要过度标榜学历或工作年限。
专家头脑:没有什么新的初学者头脑:一切都是新的专家头脑:看看我已经走了多远的初学者头脑:看看它走了多远专家头脑:我们总是这样做的初学者头脑:总是有更好的方式初学者的头脑不断学习https://t.co/trMxZPuaDv。
-尤金·严(@eugene yan)2020年8月26日。
感谢杨欣怡、莎拉·坎贝尔、斯图·福蒂埃、丹·亨特和乔尔·克里斯汀森阅读了这篇文章的草稿。
份额:
浏览相关标签:[]我写的是如何在数据科学、学习和职业中发挥作用。每周更新一次。
欢迎礼物:为期5天的电子邮件课程,介绍如何成为一名高效的数据科学家🚀