最近在知乎上看到一个问题:为什么2022年AI井喷,但是岗位需求数量没有明显增长?下面有一个回答,比较戳中我。

我们要将research和application分开来谈。都是谁在做research?高校和大公司,其实不仅是深度学习领域,互联网也是这样,大厂去造轮子,广大开发者去使用并提供反馈。research是创新,是从无到有,需要对基础知识理解较深。对于application来说,掌握轮子的使用方式是最重要的。因此,立足于现实场景,分析问题和需求,较快地写出代码才是需要的。这里,深度学习真的只是一个工具,模型不再重要,重要的是适配问题。

另外,现在深度学习发展的速度很快,作为目前的最强模型,transformer在2017年才发表,这才结束了CNN、RNN这些上个世纪的老家伙在榜单上的存在。如今,大学里面的课程不仅更新的慢(几个会教transformer?),而且是把人往researcher去教。但是,社会不需要那么多researcher, 而是应用者。不过,因为众所周知的原因,学界和社会可能是脱节的,很多时候即使所谓的教授和研究生们用深度学习为工具发文章了,那在真实问题下也是一无是处,纯属自娱自乐,骗取经费,不过也能过得挺好。

总结一下吧。我已经从学校毕业了,就应该从研究者的身份中抽离出来,然后专注于调api就行了。把深度学习作为开发应用里面的一个工具。因此,学习的重点就不是网络的原理,而是数据的收集清理,问题的解构,快速的调参这些。具体的方向就是学习fastai这种面向生产的深度学习库,并且拥抱开源社区huggingface,学会用现有工具快速解决实际问题。


如果说以后真的靠接私活赚外快的话,应该更多以解决算法问题为主。首先在别人眼里,我的研究生方向是算法方面的;其次现在市场上开发已经很饱和了,无论是速度还是便宜程度,我都很难超过淘宝那些代做的。真正能着手的,也就是算法问题了。至少是结合算法处理的web开发。

为了能完善这方面的能力,我应该去参加kaggle的竞赛,尽量涵盖多种竞赛主题,因为上面的比赛应该比较贴合实际。然后利用gradio、django等工具,将竞赛的成果(比如将预训练模型上传用于图片分类)做成网站。