分页: 1 / 2

#1 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 19:49
Cellcycle2

语言交流的 准确性也 不高, 这也是 论坛管理难度的语音特性,, :lol:

英文的话,就是 编 缩写了,毕竟有限,,,


#2 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:00
spicebush

AI对付多音字根本就不是个事,学的比人快。
AI怕的是没见过的反常规的东西。变应能力不行。


#3 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:17
Hercubic

不是事儿…海量training的中文数据反而有优势…而且壁垒巨高,海外的AI公司在中国几乎不可能打败抖音这种本土公司了


#4 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:45
Hercubic
Cellcycle2 写了: 2025年 10月 26日 19:49

语言交流的 准确性也 不高, 这也是 论坛管理难度的语音特性,, :lol:

英文的话,就是 编 缩写了,毕竟有限,,,

前段时间扎克天价收购的打标公司,据某业内人士告诉我,打标技术比抖音差远了…更别说中文打标


#5 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:45
tdm

那AI处理日语不疯了?


#6 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:47
cellcycle1
spicebush 写了: 2025年 10月 26日 20:00

AI对付多音字根本就不是个事,学的比人快。
AI怕的是没见过的反常规的东西。变应能力不行。

我说“廉颇”, 你觉得ai 怎么理解?


#7 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:50
drifter
cellcycle1 写了: 2025年 10月 26日 20:47

我说“廉颇”, 你觉得ai 怎么理解?

试一下就知道了 很容易


#8 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:51
Hercubic
cellcycle1 写了: 2025年 10月 26日 20:47

我说“廉颇”, 你觉得ai 怎么理解?

现在的AI是data center时代,大模型都训的很好的,关键在喂的数据,不然扎克疯了花大价钱买一个打标公司


#9 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 20:56
agi

不是语音训练
和同音之有毛关系
每个汉字都是一个01 编码


#10 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:01
cellcycle1
agi 写了: 2025年 10月 26日 20:56

不是语音训练
和同音之有毛关系
每个汉字都是一个01 编码

那要是死的,就完了,没有上下文,和语境,

人这周转换,几乎没有限制,知道一次就行了


#11 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:02
cellcycle1
drifter 写了: 2025年 10月 26日 20:50

试一下就知道了 很容易

还有 憋 :)


#12 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:02
spicebush
cellcycle1 写了: 2025年 10月 26日 20:47

我说“廉颇”, 你觉得ai 怎么理解?

你说的这个不是多音字。多音字是语言中固定的程序性的东西,对AI来说多不多音没差别。
当一个词出现新的意思时,其实就是我说的非常规和意外。那它学起来肯定不如人快,人脑子转个弯,就记住了。AI需要多次重新建立联系。
另外不知道我说的对不对,AI根本就不能理解什么东西。它只是根据DATA建立各种联系。


#13 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:05
cellcycle1
spicebush 写了: 2025年 10月 26日 21:02

你说的这个不是多音字。多音字是语言中固定的程序性的东西,对AI来说多不多音没差别。
当一个词出现新的意思时,其实就是我说的非常规和意外。那它学起来肯定不如人快,人脑子转个弯,就记住了。AI需要多次重新建立联系。
另外不知道我说的对不对,AI根本就不能理解什么东西。它只是根据DATA建立各种联系。

对呀,就是ai 能进步到人和人之间 “畅谈交流” 还是非常难,

专业领域,哪种有个大的固定语境的应该可以,

简单说ai 没有 “温度” 替代不了,人和人的交流,


#14 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:12
Hercubic
cellcycle1 写了: 2025年 10月 26日 21:05

对呀,就是ai 能进步到人和人之间 “畅谈交流” 还是非常难,

专业领域,哪种有个大的固定语境的应该可以,

简单说ai 没有 “温度” 替代不了,人和人的交流,

经过训练的AI可能比53还有温度,比如你和国内妹子聊天,好多流行词儿都不知道的,比如早C晚A,AI都门清


#15 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:12
spicebush
cellcycle1 写了: 2025年 10月 26日 21:05

对呀,就是ai 能进步到人和人之间 “畅谈交流” 还是非常难,

专业领域,哪种有个大的固定语境的应该可以,

简单说ai 没有 “温度” 替代不了,人和人的交流,

完全同意,AI就是从自己的数据库中找到一个能匹配你的话的东西来对付你。它根本不知道你说的是什么,它拿出来的是什么。


#16 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:13
Hercubic
spicebush 写了: 2025年 10月 26日 21:12

完全同意,AI就是从自己的数据库中找到一个能匹配你的话的东西来对付你。它根本不知道你说的是什么,它拿出来的是什么。

这取决于AI知识图谱水平


#17 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:20
spicebush

你没有get到我们讨论的问题是什么
当我们听到或说出“好吃”这个词时,脑子里想的不是这个词,而是词后面的意思。
但对于AI来说它就是一个代码。至于它这么用这个代码,取决于它的数据库

Hercubic 写了: 2025年 10月 26日 21:13

这取决于AI知识图谱水平


#18 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:22
Hercubic
spicebush 写了: 2025年 10月 26日 21:20

你没有get到我们讨论的问题是什么
当我们听到或说出“好吃”这个词时,脑子里想的不是这个词,而是词后面的意思。
但对于AI来说它就是一个代码。至于它这么用这个代码,取决于它的数据库

想什么不重要,重要的是表达出来的文字,就文字的温度而言,AI早就超越了人类


#19 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 26日 21:23
cellcycle1
spicebush 写了: 2025年 10月 26日 21:12

完全同意,AI就是从自己的数据库中找到一个能匹配你的话的东西来对付你。它根本不知道你说的是什么,它拿出来的是什么。

是的,这一方面,让我觉得 ai 不能替代人,尤其人对人的需求,,

可是 另一方面,由于人的惰性和养成依赖性, 使得人 会越来越依赖ai, 而且因为 ai 永远不会有 人的温度,或人性, 以后的人类堪忧,

所以,我希望 现在的ai 大潮要破一下,这样能放缓发展,,,需要某种磨合,发挥ai的优势,同时限制起劣势


#20 Re: 汉语同音字太多, 应该对ai 是个挑战,同时

发表于 : 2025年 10月 27日 00:25
Cellcycle2
tdm 写了: 2025年 10月 26日 20:45

那AI处理日语不疯了?

你懂日文? 日文算啥文字,也是表音的吧?