google的排序

版主: kazaawangwh

larvender楼主
著名点评
著名点评
帖子互动: 230
帖子: 3700
注册时间: 2022年 7月 23日 12:56

#41 Re: google的排序

帖子 larvender楼主 »

谢谢!
我的确应该去stem或者programming版问的,主要那几个版基本没去过
你这么一说,我想起来了

我不搞IT, 我的问题没问好,其实我困惑的是为什么有些内容我认为不应该出现在google搜索前排的却在那里,是不是有第三方可以做手脚

forecasting 写了: 2025年 3月 21日 21:20 没看过别人说的什么话,但我说的是工业界和科研界知道的关于google和其他搜索引擎搜索排序的已经公开的方法。
任何实际运行的系统或者生产系统都有一些自己特定的工程工艺,要不然,公布了原理,大家就都可以做得一样好了:即使百度不竞价排名,商业化得那么厉害,它的搜索结果也比google差得很远,原因就在于此。调参数是公开的秘密,不过到底是哪些参数就是商业机密了。所谓调参数,就是就搜索结果鉴别之后(这是要有文档/语料或者标注的语料/文档作为训练集的)就各个与排序有关的因素调整权重(机器自动测试各个权重值从而找出近似最优的来,比如就stop word list以外的词做调参,或者哪些词是stopword做调参。跟你讲个笑话,一些理论上认定相关有用的因素,最后实验证明完全无用)。
PageRank只是当初用的核心算法,并不是由它完全决定的,至于后来演化到什么地步,甚或完全抛弃,就没有关注过。
这个问题你可以到STEM或者programming版去问,在这里说,是不是太枯燥?另外,你到底要解决什么问题?是搜索吗?现在基本不值得下功夫了,你做不过google等打公司,而且当初的问题也没多大意思了。如果是做文档/语料,pagerank直接拿来用就是了,比它好用的技术/算法也有一堆。纯粹好奇,自己找点资料看看就行了。pagerank的思想主要是基于平稳随机过程(stationary stochastic process)

@larvender
回复

回到 “书歌影视美食游 - 精华区”