2020年数据科学–重点

2021-01-04 20:29:03

这篇文章是一堆经过高度修饰的😎链接,以重新介绍Data Science Topics& 2020年的技术:

直到最近(假设是2020年初),人们一直非常关注Computer Vision,Image&视频(媒体)数据。但是情况开始发生变化,2020年对于NLP来说是强劲的一年。像Hugging Face spa,spaCy,Rasa这样的公司变得更强大,也更具教育意义,最终推动了一场巨大的NLP革命(即使在行业水平上,通常也很难做到)。

数据科学家是糟糕的Web开发人员,但是如果我们需要构建可以进行语音对话或进行机器学习的Web应用程序,该怎么办?那就是这个域名越来越受欢迎的地方填充

如果ML社区的一件事给很多记者带来了快乐,那就是GPT-3。 GPT-3几乎一直都在新闻中(可能仍然如此)。用他们自己的话说:

5月,我们推出了GPT-3(迄今为止最强大的语言模型),并在不久之后推出了我们的第一个商业产品,该API使用简单的自然语言提示安全地访问人工智能模型。我们为团队的这些以及其他研究突破而感到自豪,这些突破都是我们实现安全,可靠并惠及全人类的通用AI使命的一部分

如果我告诉您,数据科学家可以将更多的时间花费在诸如“数据清理”😝和功能工程之类的关键事情上,而花更少的时间实际选择/构建最佳“模型” **。这基本上就是Auto ML的前提(这就是我的看法)。

最后,模型很容易在Jupyter Notebooks上构建。我们都知道,只需要几行代码,您的`model.fit()`已经准备就绪。但是接下来呢?多亏了对ML Ops的关注,将这些模型推向产品的新工具和技术可以打破大多数模型都死在PPT或Jupyter Notebook上的数据科学神话!

除此之外,还有诸如FastAI(Pytorch库),可解释性机器学习(俗称可扩展AI),GAN,一阶运动,设备上ML(tensorflow.js / coreML)之类的主题/技术,它们也在不断发展并且正在发展。 值得一试! 总体而言,对于数据科学与技术展而言,这是令人称奇的一年。 炒作速度放慢的机器学习(糟糕,抱歉,我忘记了仍在运行的GPT-3炒作火车)并提高了成熟度 如果您喜欢这个,请❤️此新闻通讯并与您的朋友分享!