如何在这波产业革命中立足

版主: hci

fantasist
见习点评
见习点评
帖子互动: 150
帖子: 1331
注册时间: 2022年 7月 24日 19:52

#161 Re: 如何在这波产业革命中立足

帖子 fantasist »

magagop 写了: 2025年 1月 10日 03:09 『短板在计算能力(主要是逻辑推理)上。』,你說的短板不是o3用CoT已經解決了嗎?今年一定能看到o3的精彩表演。
我是说o1 o3这些在努力实现系统2,不是已经解决的问题。我的直觉是,纯文字对于理解这个世界的常识可能不够,比如苹果会从树上往下掉。需要多模态训练来提升这方面的能力,似乎李飞飞的公司专门做这个。反正我不是站在最前沿的researcher,能提升多少,得看这几个头部的成果。
magagop
见习点评
见习点评
帖子互动: 86
帖子: 1385
注册时间: 2024年 12月 5日 17:35

#162 Re: 如何在这波产业革命中立足

帖子 magagop »

fantasist 写了: 2025年 1月 10日 11:30 我是说o1 o3这些在努力实现系统2,不是已经解决的问题。我的直觉是,纯文字对于理解这个世界的常识可能不够,比如苹果会从树上往下掉。需要多模态训练来提升这方面的能力,似乎李飞飞的公司专门做这个。反正我不是站在最前沿的researcher,能提升多少,得看这几个头部的成果。
人類從看到蘋果從樹上落下,到牛頓用邏輯推理出萬有引力定律,花了幾十萬年。LLM才幾年而已,再等等看,AI才剛剛開始。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#163 Re: 如何在这波产业革命中立足

帖子 hahan »

你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
急急如丧家之犬
忙忙似漏网之鱼
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#164 Re: 如何在这波产业革命中立足

帖子 hahan »

hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
而且这种把linear regression 叠到一起然后引入一些stochastic elements的所谓的神经网络的智能
纯粹就是搞笑的
这个领域的人都是些匠人
急急如丧家之犬
忙忙似漏网之鱼
newstart
知名作家
知名作家
帖子互动: 150
帖子: 884
注册时间: 2022年 10月 14日 04:39

#165 Re: 如何在这波产业革命中立足

帖子 newstart »

magagop 写了: 2025年 1月 10日 13:52 人類從看到蘋果從樹上落下,到牛頓用邏輯推理出萬有引力定律,花了幾十萬年。LLM才幾年而已,再等等看,AI才剛剛開始。
你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
叔的话看看就行,叔只是来娱乐的 :mrgreen: :mrgreen:
magagop
见习点评
见习点评
帖子互动: 86
帖子: 1385
注册时间: 2024年 12月 5日 17:35

#166 Re: 如何在这波产业革命中立足

帖子 magagop »

newstart 写了: 2025年 1月 10日 14:48 你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
別的不知道,AI確實吸引了很多投資和注意力還有年輕人,這就夠了,人多力量大,力大飛磚,總比冷門領域強。我可不想把余生都浪費在RF Filters這種領域。
magagop
见习点评
见习点评
帖子互动: 86
帖子: 1385
注册时间: 2024年 12月 5日 17:35

#167 Re: 如何在这波产业革命中立足

帖子 magagop »

hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
越普通的任務越寬泛,越寬泛的任務越不好實現。我不指望LLM能實現寬泛任務,LLM能像compiler那樣完成一個專門任務就好,譬如編寫C卄
fantasist
见习点评
见习点评
帖子互动: 150
帖子: 1331
注册时间: 2022年 7月 24日 19:52

#168 Re: 如何在这波产业革命中立足

帖子 fantasist »

hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
给点prompt,自动订度假酒店机票的agent,应该是已经有实现了。我团队两个月前花两周做的demo已经能控制一个手机模拟器实现类似功能,比如点外卖之类的。控制手机缺乏稳定接口,是比较头疼的工程问题,也许手机agent只有跟厂商深度合作才能搞出真正的产品。相对来说agent控制电脑(windows)更容易一点,我没研究过有哪些startup在做此类应用,但技术上是可行的,开源framework也有了。
上次由 fantasist 在 2025年 1月 10日 23:07 修改。
fantasist
见习点评
见习点评
帖子互动: 150
帖子: 1331
注册时间: 2022年 7月 24日 19:52

#169 Re: 如何在这波产业革命中立足

帖子 fantasist »

newstart 写了: 2025年 1月 10日 14:48 你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
你的认知是错误的,直接问o1能得到正确答案。

早在去年9月,我试出来只要给gpt4o 1 shot,它就能数strawberry里的r。逻辑能力较弱,但不是没有。
有兴趣的话可以把这个困难版prompt(单词拼写加了额外的typo,确保不撞上训练数据)丢给各种模型试试。至少当前版本的gpt4o能轻松解决:

Given example

Question: how many "a"s are in word "avatar"?

Answer: "avatar" spells as ["a", "v", "a", "t", "a", "r"]. Scanning

through each letter, starting with count = 0. "a" is "a", count = 0 + 1 =

1. "v" is not "a", skip. "a" is "a", count = 1 + 1 = 2. "t" is not

"a", skip. "a" is "a", count = 2 + 1 = 3. "r" is not "a", skip. So there

are 3 "a"s in the word "avatar".


Answer the following question in similar steps:

how many "n"s are in word "ninkkedinn"?
mn(锰)
正式会员
正式会员
帖子互动: 5
帖子: 10
注册时间: 2024年 6月 25日 17:24

#170 Re: 如何在这波产业革命中立足

帖子 mn(锰) »

回错贴了。。。但不知如何删贴。。。
===
所以 LLM 更可能在 coding 这块儿落地?跟人的语言比,程序语言小,干净,形式化。更重要的是可测试可验证。
上次由 mn 在 2025年 1月 11日 10:09 修改。
uws
见习点评
见习点评
帖子互动: 98
帖子: 1612
注册时间: 2022年 12月 23日 12:21

#171 Re: 如何在这波产业革命中立足

帖子 uws »

hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
不用管价格的话基本能实现了
uws
见习点评
见习点评
帖子互动: 98
帖子: 1612
注册时间: 2022年 12月 23日 12:21

#172 Re: 如何在这波产业革命中立足

帖子 uws »

jiml 写了: 2025年 1月 9日 15:15 十年前,做完准确预测后,你有啥具体行动?

相同时期,叔也做出了类似的预测,然后寻找ai趋势里获益最大的股票。初选两家,谷歌和英伟达,一软一硬。再深入研究后判断,硬件是ai趋势的根本动力。然后,叔做出了这辈子最成功的投资行动,开始建仓英伟达股票,重仓,10年前。以后,不论股票市场如何波动,长持英伟达是一种信仰。
牛b, 能否分享一下目前你对下个十年的预测以及用哪些股票会获益?
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#173 Re: 如何在这波产业革命中立足

帖子 hahan »

fantasist 写了: 2025年 1月 10日 22:54 给点prompt,自动订度假酒店机票的agent,应该是已经有实现了。我团队两个月前花两周做的demo已经能控制一个手机模拟器实现类似功能,比如点外卖之类的。控制手机缺乏稳定接口,是比较头疼的工程问题,也许手机agent只有跟厂商深度合作才能搞出真正的产品。相对来说agent控制电脑(windows)更容易一点,我没研究过有哪些startup在做此类应用,但技术上是可行的,开源framework也有了。
实现不难
套点逻辑就可以
但这个结果能让我满意吗

如果不能
这个agent的意义在哪里
急急如丧家之犬
忙忙似漏网之鱼
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#174 Re: 如何在这波产业革命中立足

帖子 hahan »

uws 写了: 2025年 1月 11日 08:49 不用管价格的话基本能实现了
你咋不说不管目的地呢
实现的标准
就是有人愿意在实际生活中愿意用 不是体验新鲜那种用

就先不说能不能赚钱了
急急如丧家之犬
忙忙似漏网之鱼
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#175 Re: 如何在这波产业革命中立足

帖子 hahan »

fantasist 写了: 2025年 1月 10日 23:05 你的认知是错误的,直接问o1能得到正确答案。

早在去年9月,我试出来只要给gpt4o 1 shot,它就能数strawberry里的r。逻辑能力较弱,但不是没有。
有兴趣的话可以把这个困难版prompt(单词拼写加了额外的typo,确保不撞上训练数据)丢给各种模型试试。至少当前版本的gpt4o能轻松解决:

Given example

Question: how many "a"s are in word "avatar"?

Answer: "avatar" spells as ["a", "v", "a", "t", "a", "r"]. Scanning

through each letter, starting with count = 0. "a" is "a", count = 0 + 1 =

1. "v" is not "a", skip. "a" is "a", count = 1 + 1 = 2. "t" is not

"a", skip. "a" is "a", count = 2 + 1 = 3. "r" is not "a", skip. So there

are 3 "a"s in the word "avatar".


Answer the following question in similar steps:

how many "n"s are in word "ninkkedinn"?

这种估计是专门喂数据train出来的
不代表有逻辑能力

简单的说
一个小孩
根本不用学习几十亿张桌子才知道什么叫桌子
这个问题
很多哲学家很早以前就讨论过

所以我说这些搞AI的都是匠人
说难听点就是农民工
急急如丧家之犬
忙忙似漏网之鱼
uws
见习点评
见习点评
帖子互动: 98
帖子: 1612
注册时间: 2022年 12月 23日 12:21

#176 Re: 如何在这波产业革命中立足

帖子 uws »

hahan 写了: 2025年 1月 11日 11:12 实现不难
套点逻辑就可以
但这个结果能让我满意吗

如果不能
这个agent的意义在哪里
这个问题的难点在于每个人对于机票和行程酒店的utility function千差万别。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#177 Re: 如何在这波产业革命中立足

帖子 hahan »

uws 写了: 2025年 1月 11日 12:29 这个问题的难点在于每个人对于机票和行程酒店的utility function千差万别。
智能不就是干这事么
否则要ai何用?
革命在哪里
急急如丧家之犬
忙忙似漏网之鱼
fantasist
见习点评
见习点评
帖子互动: 150
帖子: 1331
注册时间: 2022年 7月 24日 19:52

#178 Re: 如何在这波产业革命中立足

帖子 fantasist »

hahan 写了: 2025年 1月 11日 11:18 这种估计是专门喂数据train出来的
不代表有逻辑能力

简单的说
一个小孩
根本不用学习几十亿张桌子才知道什么叫桌子
这个问题
很多哲学家很早以前就讨论过

所以我说这些搞AI的都是匠人
说难听点就是农民工
用文字描述一个苹果从树上掉下来,打在桌子上,然后滚到地上,没亲眼见过的人不容易理解。但远不如人类的动物大脑只要看见一次都能很快理解这个概念。所以我前边的回帖说,很可能要用多模态数据进行预训练,才能更有效的提升逻辑能力。
上次由 fantasist 在 2025年 1月 11日 13:11 修改。
fantasist
见习点评
见习点评
帖子互动: 150
帖子: 1331
注册时间: 2022年 7月 24日 19:52

#179 Re: 如何在这波产业革命中立足

帖子 fantasist »

hahan 写了: 2025年 1月 11日 11:12 实现不难
套点逻辑就可以
但这个结果能让我满意吗

如果不能
这个agent的意义在哪里
我觉得现在所有的building block都有了:图片、视频理解,planning,action等。从0到1的框架已经实现。
至于结果能不能让你满意,是从1到10,甚至从10到99的问题。
你可以想想,找一个人类agent帮你订行程,是不是要反复交流、prompt,以达到预期的效果。AI agent能不能像读心术一样一个简单的指令就生成让你百分百满意的结果,目前肯定还没到那个阶段,但沟通、提高结果质量的能力是有的。要说这个level的AI agent的意义在哪里,最直观的是比人类agent便宜、knowledgeful、容易scale。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 786
帖子: 17443
注册时间: 2022年 7月 23日 23:48

#180 Re: 如何在这波产业革命中立足

帖子 hahan »

fantasist 写了: 2025年 1月 11日 13:10 我觉得现在所有的building block都有了:图片、视频理解,planning,action等。从0到1的框架已经实现。
至于结果能不能让你满意,是从1到10,甚至从10到99的问题。
你可以想想,找一个人类agent帮你订行程,是不是要反复交流、prompt,以达到预期的效果。AI agent能不能像读心术一样一个简单的指令就生成让你百分百满意的结果,目前肯定还没到那个阶段,但沟通、提高结果质量的能力是有的。要说这个level的AI agent的意义在哪里,最直观的是比人类agent便宜、knowledgeful、容易scale。

这个use case我之所以说
还真就是我之前回国用过
就是完全不能用
比如我要去好几个地方
那机票酒店得衔接上吧
有的地方只是为了休息住一晚等第二天的飞机
那得找个离机场近的酒店吧
然后从酒店到机场的时间
航班价格和时间的compromise
就这些个人类agent能很快根据common sense判断的问题
现在的chatgpt 和 Gemini 斗搞不定
试了几个Agent 错误就更多了

一个task你掰开揉碎
是有很多小task
然后每个task 都要做判断决定
每个tssk之间也不是independent
急急如丧家之犬
忙忙似漏网之鱼
回复

回到 “葵花宝典(Programming)”