我是说o1 o3这些在努力实现系统2,不是已经解决的问题。我的直觉是,纯文字对于理解这个世界的常识可能不够,比如苹果会从树上往下掉。需要多模态训练来提升这方面的能力,似乎李飞飞的公司专门做这个。反正我不是站在最前沿的researcher,能提升多少,得看这几个头部的成果。
如何在这波产业革命中立足
版主: hci
#161 Re: 如何在这波产业革命中立足
#162 Re: 如何在这波产业革命中立足
人類從看到蘋果從樹上落下,到牛頓用邏輯推理出萬有引力定律,花了幾十萬年。LLM才幾年而已,再等等看,AI才剛剛開始。fantasist 写了: 2025年 1月 10日 11:30 我是说o1 o3这些在努力实现系统2,不是已经解决的问题。我的直觉是,纯文字对于理解这个世界的常识可能不够,比如苹果会从树上往下掉。需要多模态训练来提升这方面的能力,似乎李飞飞的公司专门做这个。反正我不是站在最前沿的researcher,能提升多少,得看这几个头部的成果。
#163 Re: 如何在这波产业革命中立足
你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#165 Re: 如何在这波产业革命中立足
你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
叔的话看看就行,叔只是来娱乐的



#166 Re: 如何在这波产业革命中立足
別的不知道,AI確實吸引了很多投資和注意力還有年輕人,這就夠了,人多力量大,力大飛磚,總比冷門領域強。我可不想把余生都浪費在RF Filters這種領域。newstart 写了: 2025年 1月 10日 14:48 你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
#167 Re: 如何在这波产业革命中立足
越普通的任務越寬泛,越寬泛的任務越不好實現。我不指望LLM能實現寬泛任務,LLM能像compiler那樣完成一個專門任務就好,譬如編寫C卄hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
#168 Re: 如何在这波产业革命中立足
给点prompt,自动订度假酒店机票的agent,应该是已经有实现了。我团队两个月前花两周做的demo已经能控制一个手机模拟器实现类似功能,比如点外卖之类的。控制手机缺乏稳定接口,是比较头疼的工程问题,也许手机agent只有跟厂商深度合作才能搞出真正的产品。相对来说agent控制电脑(windows)更容易一点,我没研究过有哪些startup在做此类应用,但技术上是可行的,开源framework也有了。hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
上次由 fantasist 在 2025年 1月 10日 23:07 修改。
#169 Re: 如何在这波产业革命中立足
你的认知是错误的,直接问o1能得到正确答案。newstart 写了: 2025年 1月 10日 14:48 你这是前提LLM是一条正确的路。对于一个消耗了数年大量计算但是仍然不会数starrrrbery里面有几个“r“的智能AI,我很欢迎他作为一个非常好的信息refine的系统协助人作为决策者,但是严重怀疑过度炒作AI只能认为他可以reasoning这条路是个正确的路。
早在去年9月,我试出来只要给gpt4o 1 shot,它就能数strawberry里的r。逻辑能力较弱,但不是没有。
有兴趣的话可以把这个困难版prompt(单词拼写加了额外的typo,确保不撞上训练数据)丢给各种模型试试。至少当前版本的gpt4o能轻松解决:
Given example
Question: how many "a"s are in word "avatar"?
Answer: "avatar" spells as ["a", "v", "a", "t", "a", "r"]. Scanning
through each letter, starting with count = 0. "a" is "a", count = 0 + 1 =
1. "v" is not "a", skip. "a" is "a", count = 1 + 1 = 2. "t" is not
"a", skip. "a" is "a", count = 2 + 1 = 3. "r" is not "a", skip. So there
are 3 "a"s in the word "avatar".
Answer the following question in similar steps:
how many "n"s are in word "ninkkedinn"?
#170 Re: 如何在这波产业革命中立足
回错贴了。。。但不知如何删贴。。。
===
所以 LLM 更可能在 coding 这块儿落地?跟人的语言比,程序语言小,干净,形式化。更重要的是可测试可验证。
===
所以 LLM 更可能在 coding 这块儿落地?跟人的语言比,程序语言小,干净,形式化。更重要的是可测试可验证。
上次由 mn 在 2025年 1月 11日 10:09 修改。
#171 Re: 如何在这波产业革命中立足
不用管价格的话基本能实现了hahan 写了: 2025年 1月 10日 14:03 你们这些扯的有的没的
就最简单的一个use case
Llm啦 agent啦 whatever
帮我订度假的酒店机票
5年之内根本就做不出来
话放这
#172 Re: 如何在这波产业革命中立足
牛b, 能否分享一下目前你对下个十年的预测以及用哪些股票会获益?jiml 写了: 2025年 1月 9日 15:15 十年前,做完准确预测后,你有啥具体行动?
相同时期,叔也做出了类似的预测,然后寻找ai趋势里获益最大的股票。初选两家,谷歌和英伟达,一软一硬。再深入研究后判断,硬件是ai趋势的根本动力。然后,叔做出了这辈子最成功的投资行动,开始建仓英伟达股票,重仓,10年前。以后,不论股票市场如何波动,长持英伟达是一种信仰。
#173 Re: 如何在这波产业革命中立足
实现不难fantasist 写了: 2025年 1月 10日 22:54 给点prompt,自动订度假酒店机票的agent,应该是已经有实现了。我团队两个月前花两周做的demo已经能控制一个手机模拟器实现类似功能,比如点外卖之类的。控制手机缺乏稳定接口,是比较头疼的工程问题,也许手机agent只有跟厂商深度合作才能搞出真正的产品。相对来说agent控制电脑(windows)更容易一点,我没研究过有哪些startup在做此类应用,但技术上是可行的,开源framework也有了。
套点逻辑就可以
但这个结果能让我满意吗
如果不能
这个agent的意义在哪里
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#175 Re: 如何在这波产业革命中立足
fantasist 写了: 2025年 1月 10日 23:05 你的认知是错误的,直接问o1能得到正确答案。
早在去年9月,我试出来只要给gpt4o 1 shot,它就能数strawberry里的r。逻辑能力较弱,但不是没有。
有兴趣的话可以把这个困难版prompt(单词拼写加了额外的typo,确保不撞上训练数据)丢给各种模型试试。至少当前版本的gpt4o能轻松解决:
Given example
Question: how many "a"s are in word "avatar"?
Answer: "avatar" spells as ["a", "v", "a", "t", "a", "r"]. Scanning
through each letter, starting with count = 0. "a" is "a", count = 0 + 1 =
1. "v" is not "a", skip. "a" is "a", count = 1 + 1 = 2. "t" is not
"a", skip. "a" is "a", count = 2 + 1 = 3. "r" is not "a", skip. So there
are 3 "a"s in the word "avatar".
Answer the following question in similar steps:
how many "n"s are in word "ninkkedinn"?
这种估计是专门喂数据train出来的
不代表有逻辑能力
简单的说
一个小孩
根本不用学习几十亿张桌子才知道什么叫桌子
这个问题
很多哲学家很早以前就讨论过
所以我说这些搞AI的都是匠人
说难听点就是农民工
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#178 Re: 如何在这波产业革命中立足
用文字描述一个苹果从树上掉下来,打在桌子上,然后滚到地上,没亲眼见过的人不容易理解。但远不如人类的动物大脑只要看见一次都能很快理解这个概念。所以我前边的回帖说,很可能要用多模态数据进行预训练,才能更有效的提升逻辑能力。hahan 写了: 2025年 1月 11日 11:18 这种估计是专门喂数据train出来的
不代表有逻辑能力
简单的说
一个小孩
根本不用学习几十亿张桌子才知道什么叫桌子
这个问题
很多哲学家很早以前就讨论过
所以我说这些搞AI的都是匠人
说难听点就是农民工
上次由 fantasist 在 2025年 1月 11日 13:11 修改。
#179 Re: 如何在这波产业革命中立足
我觉得现在所有的building block都有了:图片、视频理解,planning,action等。从0到1的框架已经实现。
至于结果能不能让你满意,是从1到10,甚至从10到99的问题。
你可以想想,找一个人类agent帮你订行程,是不是要反复交流、prompt,以达到预期的效果。AI agent能不能像读心术一样一个简单的指令就生成让你百分百满意的结果,目前肯定还没到那个阶段,但沟通、提高结果质量的能力是有的。要说这个level的AI agent的意义在哪里,最直观的是比人类agent便宜、knowledgeful、容易scale。
#180 Re: 如何在这波产业革命中立足
fantasist 写了: 2025年 1月 11日 13:10 我觉得现在所有的building block都有了:图片、视频理解,planning,action等。从0到1的框架已经实现。
至于结果能不能让你满意,是从1到10,甚至从10到99的问题。
你可以想想,找一个人类agent帮你订行程,是不是要反复交流、prompt,以达到预期的效果。AI agent能不能像读心术一样一个简单的指令就生成让你百分百满意的结果,目前肯定还没到那个阶段,但沟通、提高结果质量的能力是有的。要说这个level的AI agent的意义在哪里,最直观的是比人类agent便宜、knowledgeful、容易scale。
这个use case我之所以说
还真就是我之前回国用过
就是完全不能用
比如我要去好几个地方
那机票酒店得衔接上吧
有的地方只是为了休息住一晚等第二天的飞机
那得找个离机场近的酒店吧
然后从酒店到机场的时间
航班价格和时间的compromise
就这些个人类agent能很快根据common sense判断的问题
现在的chatgpt 和 Gemini 斗搞不定
试了几个Agent 错误就更多了
一个task你掰开揉碎
是有很多小task
然后每个task 都要做判断决定
每个tssk之间也不是independent
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼