人生建议,技术人一定要学AI大模型,时代已来!

图片

2025年,建议所有技术人、互联网人尽快把AI学起来,用在自己的工作或者生活里,跟随技术和时代的变革。

在之前的文章中,我提到过为什么每个技术人都应该拥抱AI。而今天的重点是分享如何快速入门AI大模型技术。无论你是前端、后端工程师,还是对互联网技术感兴趣的读者,都希望能从这篇文章中获得一些有价值的启发。

先说个题外话:最近,我的文章更新频率有所降低,一方面是因为纯技术类的内容流量确实不高,读者反馈也较少;不管如何我会继续分享原创内容,给大家带来有价值的技术与成长干货分享。

回到正题,最近我重新投入到AI的学习中,这也是今天这篇文章的主旨——分享我最近一些入门的经验和知识。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!(毕竟几年前感兴趣学习了机器学习和推荐相关知识,后边忙其他方向也就没继续…)也不要觉得AI底层技术很难学,关键在于怎么一点点啃理论并和项目验证结合来练。

你可能会觉得我有些夸张,但实际上,就现在技术行业特别是互联网软件行业,已经有大量的技术在持续降低门槛、人员裁减也基本成为常态。没办法新业务和技术难度都在减弱,如果还坚守在原有的阵地,可能也不是一个更好的选择,AI时代,一切发展太快,现在在去找一些基础开发、前端开发特别是网页类,这些低门槛工作完全可AI实现….技术人应该觉醒了。

是不是AI时代,所有的程序员会淘汰?绝对不是。\

更有一些外行说所有人都跨行都来学编程?这个也不现实的,技术人也不用怕,里面还是有一定的门槛的,即便是AI时代,想跨行来做还是要有些基础知识和理论的,否则也无法结合AI来编程。

说了这么多,目的是想打消技术人过度的焦虑,然后找对方法,来提升自己。

技术人怎么学?

那作为技术人,我觉得我们要做使用AI、调教AI的人,而不是被AI代替的人,用好AI这个智能工具服务更多业务。

最好不要通过学习通过各种工具怎么生成图片、怎么生成视频,加一些特效,这些技能不是不可以学,作为技术人不应该重点学这些,因为这些东西门槛低,不能构成技术人的护城河。随着普及会会变成2000年左右的打字员一样的工种,技术人的核心要学怎么结合AI生产自己行业的工具,调优工具,而不是使用工具。

所以,如果上边我说的这个话你有共鸣,那我最近在重新学习的AI相关东西你应该也能领悟,我们先来思考下这几个问题。

AI大模型本质是什么?

大模型的本质是一种统计推理的工具,通过在大规模数据上进行训练,内化并表达出广泛的知识和技能。它们具备高度的通用性和适应性,可以通过适当的调优应对多种任务,并展示出一定的类推理能力。

如果我们想做一些AI大模型的工作,这里面当然会有很多方向可做, 我觉得可以选取一个自己感兴趣的。所有这些的一切就是先从大模型的工作原理来开始。

之前写的文章,大模型里相关文章有原理的漫谈,AI时代:玩AI却不懂一点原理,真的靠谱吗?这个也是相关的原理构成,大概原理知道后,就可以开始把组成的某一个部分开始进行理解。

学习方法建议:

个人的建议,如果之前不是机器学习方向的,很可能就被概念和名词就会卡住,以为最近开始的学习来讲,不用怕,那个不懂学习那个,然后慢慢拼凑出一个概貌。学习最重要的途径,就是直接尝试做,遇到卡住的地方,再寻找方法补足技能,再尝试,如此循环。

比较核心一点,不要上来就勇猛的学各种书籍,比如机器学习、线性代数、微积分、离散数学,如果是学生阶段那没错,如果是已经工作的建议还是先把大模型相关操作和原理开始,遇到什么不清楚就查什么,然后继续,这样比直接啃基础反而快一些,但基础这些还是要啃。这些东西别指望一看就懂,一看就会,先吃一点,那个概念原理不清楚就去查,然后继续往下走,比如一些算法怎能也想不通,先跳过。然后空闲就把线性代数、离散数学、这些学一些。

方法有了,给大家分享下最近根据原理来重新学习的一些书籍和知识, 比如从transformer原理看,可能会遇到一些向量问题、机器学习问题,如果对向量不熟,可能就得查一下线性代数,如果对训练的过程不懂,就看下机器学习监督学习、无监督学习、强化学习这些概念。

路线上可以从入门开始:

1.大语言模型的基础知识和常见术语和原理开始,最重要的是实际操作。

2.可以在本地环境搭建开源模型的推理环境。

3.了解下大模型的应用开发框架( LangChain、Dify)Prompt 工程、 RAG、Agent 等大模型应用开发范式

4.大模型的训练微调、数据工程、推理优化,训练自己业务行业的大模型。

总之就是围绕怎么训练一个自己的大模型,这里面可能就会涉及上面的一系列问题,也需要补充各种理论基础,编程语言(比如对python)深度学习框架 PyTorch、TensorFlow等、分布式训练、模型调优等等。

上边提到的知识点都可以在网上找到不错的教程,推荐openai gpt和 llama 来开展学习,毕竟国内很多的大模型都也是套壳llama的。

自己在看的资料:

这块的资料很多,我一般不怎么推荐,因为每个人的学习方法不同,可以结合自己来,我目前在看的一些资料比如机器学习的经典可以看看周志华的机器学习,当成工具来查阅,其他的就是上边说的线性代数、离散数学,目前还没有进入深水区后边会继续分享,先推荐必学平台和书籍:

图片

https://learn.deeplearning.ai/ 吴恩达(Andrew Ng)创办里面有很多教程

另外2本必看的书籍推荐:

https://llmbook-zh.github.io/ 《大语言模型》

https://zh.d2l.ai/ 《动手学深度学习》