首页 > 都市重生 > 职场小聪明 > 第900章 大模型编程和普通编程的区别

第900章 大模型编程和普通编程的区别(1/2)

目录

大模型编程和普通编程的区别,是大模型不需要很严密的逻辑推理,都是y=x*w的意思,就是有个结果y,然后用w就是一个算法,不断的代入特定的x,然后得出一个模型,然后评估y的准确率,有了模型,就只用代入x,就可以得到一个结果y,但y不一定准确,无限接近正确,就像一个苹果,它是苹果的相似度有多少,差不多就行了,大概就是个苹果,哈哈。

你这个理解很有意思,而且抓住了一个大模型编程与传统编程的核心区别:大模型是“近似正确”,传统编程是“绝对正确”。这正是深度学习模型(如大语言模型、图像识别模型)与传统编程逻辑的根本差异。

?

一、大模型编程与传统编程的本质区别

我们可以从多个角度来比较:

维度

传统编程(Rule-based)

大模型编程(odel-based)

核心思想

明确规则推导结果

用大量样本学出模式

推理方式

逻辑推理、条件判断

概率推理、模式匹配

编程方式

精确代码控制逻辑

训练模型得到“权重”

数据使用

少量、结构化

大量、非结构化

输出结果

精确、唯一

模糊、近似、概率性

可解释性

强:代码可读

弱:黑箱,靠可视化或经验解释

示例

if-else,for循环等

y=wx+b+激活函数(如ReLU)

你说的那句“大模型其实就是y=x*w的不断代入和评估”——可以说非常贴切地表达了深度学习中模型训练的过程。我们来进一步拆解这个观点。

?

二、用“y=x·w”理解大模型的核心机制

1.输入(x)

这是你给模型喂的特征,比如:

?\t图像识别中,一张图片的像素矩阵

?\t语言模型中,一段文本被嵌入成词向量

?\t音频识别中,是声波的频谱特征

2.权重(w)

这个可以理解为“模型的记忆”或“经验参数”。这些参数并不是你手动写出来的,而是模型从成千上万的数据中“学出来”的。

比如说,模型在看了10万个“苹果”的图像后,自己推理出哪些像素模式是“苹果”的共同特征,然后把这些“经验”编码进权重w里。

3.输出(y)

就是模型对x的一个“预测”,这个预测并不是100%准确的,而是“在经验基础上,最有可能是的那个结果”。

?

三、大模型编程的流程:本质是“调数据,不调逻辑”

传统编程流程是:

if天气==“下雨”:

带伞else:

出门大模型编程的流程:

收集大量“天气+行为”的数据:

(晴天,出门)

(下雨,带伞)

(阴天,出门)

...

喂给模型训练,学出一套权重w

模型预测时,只需输入“天气=下雨”->输出“带伞”的概率高,就预测“带伞”

你不需要再写规则,而是“让数据说话”。

这就是所谓的:

传统编程是“人定规则”,大模型是“模型学规则”。

?

四、再回到你的比喻:“大概是个苹果”

你说得非常生动:

本章未完,点击下一页继续阅读。

目录
返回顶部