现在的LLM本质上是一种数据库
版主: verdelite, TheMatrix
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#1 现在的LLM本质上是一种数据库
现在的LLM本质上是一种数据库,
普通数据库是用结构化的SQL语言来query,内存里面是一些结构化的二维表格。这种数据库存不了特别复杂的逻辑。
LLM存储的自然语言的资料,也是用自然语言来query,自然语言的表现力远远大于SQL语言
LLM和真正的智能有没有关系?
我认为有关系,人脑里面也有一个类似LLM的存储单元,但是这并不是全部。OpenAI想通过扩大训练LLM达到AGI是不可能成功的。
普通数据库是用结构化的SQL语言来query,内存里面是一些结构化的二维表格。这种数据库存不了特别复杂的逻辑。
LLM存储的自然语言的资料,也是用自然语言来query,自然语言的表现力远远大于SQL语言
LLM和真正的智能有没有关系?
我认为有关系,人脑里面也有一个类似LLM的存储单元,但是这并不是全部。OpenAI想通过扩大训练LLM达到AGI是不可能成功的。
x1

-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#4 Re: 现在的LLM本质上是一种数据库
就是“熟读唐诗三百首,不会吟诗也会绺”。。。 拼命加料堆训练,企图堆出个诗仙李白来。。。 或许在绺打油诗方面的确超过李白,但你稍微超纲一点儿,问他“日照香炉生紫烟”淫荡在哪里它就虾米了。。。
对于任何已经界定好的、有明确边界的问题,它都能做到极致。。。 可问题是世界是无边无际的,绝大部分问题根本就没有被发现,没有人定义。。。
对于任何已经界定好的、有明确边界的问题,它都能做到极致。。。 可问题是世界是无边无际的,绝大部分问题根本就没有被发现,没有人定义。。。
跳出三界外,不在五行中
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#8 Re: 现在的LLM本质上是一种数据库
唐诗很多是触景生情macarthur 写了: 2024年 10月 15日 16:18 就是“熟读唐诗三百首,不会吟诗也会绺”。。。 拼命加料堆训练,企图堆出个诗仙李白来。。。 或许在绺打油诗方面的确超过李白,但你稍微超纲一点儿,问他“日照香炉生紫烟”淫荡在哪里它就虾米了。。。
对于任何已经界定好的、有明确边界的问题,它都能做到极致。。。 可问题是世界是无边无际的,绝大部分问题根本就没有被发现,没有人定义。。。
比如月落乌啼霜满天,江枫渔火对愁眠
这个场景不是一些词语随便组合出来的
愁,和渔火,乌啼在语义上并没有逻辑联系,
但是人可以感知到这种情感上的联系
LLM只是copycat
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#10 Re: 现在的LLM本质上是一种数据库
你再想想Caravel 写了: 2024年 10月 15日 16:30 唐诗很多是触景生情
比如月落乌啼霜满天,江枫渔火对愁眠
这个场景不是一些词语随便组合出来的
愁,和渔火,乌啼在语义上并没有逻辑联系,
但是人可以感知到这种情感上的联系
LLM只是copycat
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#12 Re: 现在的LLM本质上是一种数据库
我不知道正确的答案是什么。
但我认为楼主说的没啥道理,你应该没有真正哪怕是在很浅的层面了解过自从Alpahgo以来,AI发展在技术层面的原因。
但我认为楼主说的没啥道理,你应该没有真正哪怕是在很浅的层面了解过自从Alpahgo以来,AI发展在技术层面的原因。
智者无惑,仁者无忧,爱者无惧。
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#13 Re: 现在的LLM本质上是一种数据库
你啥都不知道,如何知道别人不懂?Helsinki 写了: 2024年 10月 15日 17:16 我不知道正确的答案是什么。
但我认为楼主说的没啥道理,你应该没有真正哪怕是在很浅的层面了解过自从Alpahgo以来,AI发展在技术层面的原因。
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#16 Re: 现在的LLM本质上是一种数据库
我觉得你并没有看出端倪。而是提出了问题。
一般来讲,提出好的问题,本身就是一件很牛
你标题中的这个问题,算不上好问题,可以凑活算是个中不留的问题。后面提供的答案/端倪的解读,我就没有再发现有什么有价值的东西了。
智者无惑,仁者无忧,爱者无惧。
#17 Re: 现在的LLM本质上是一种数据库
Caravel 写了: 2024年 10月 15日 16:30 唐诗很多是触景生情
比如月落乌啼霜满天,江枫渔火对愁眠
这个场景不是一些词语随便组合出来的
愁,和渔火,乌啼在语义上并没有逻辑联系,
但是人可以感知到这种情感上的联系
LLM只是copycat
屁大点事儿,车载 AI 触景转弯、触景刹车都能做到,还做不到触景生情?
上 Hugging Face 下一个 image-to-text (或称 image captioning) 的模型
再下一个 seq2seq 模型把日常语言转换为诗化语言,这个 Hugging Face 上可能没有现成的,不过训练一个也很简单
用 Hugging Face pipeline 把以上步骤串联在一起
本科高年级几天的作业
-
- 论坛元老
Caravel 的博客 - 帖子互动: 513
- 帖子: 23533
- 注册时间: 2022年 7月 24日 17:21
#18 Re: 现在的LLM本质上是一种数据库
你这种触景生情是copycat,没有人写月落乌啼,LLM就不知道原来这是悲伤的环境。Alcaraz 写了: 2024年 10月 15日 20:40 屁大点事儿,车载 AI 触景转弯、触景刹车都能做到,还做不到触景生情?
上 Hugging Face 下一个 image-to-text (或称 image captioning) 的模型
再下一个 seq2seq 模型把日常语言转换为诗化语言,这个 Hugging Face 上可能没有现成的,不过训练一个也很简单
用 Hugging Face pipeline 把以上步骤串联在一起
本科高年级几天的作业