对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。
	版主: Softfist
			
		
		
			- 
				
																			 noparking
- 知名作家
  
- 帖子互动: 18
- 帖子: 823
- 注册时间: 2022年 8月 12日 09:17
						
					
													
							
						
									
						帖子
					
								由 noparking » 
			
			
			
			
			
			
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 freelikewind
- 知名作家
  
- 帖子互动: 83
- 帖子: 1022
- 注册时间: 2022年 7月 23日 15:32
						
					
													
							
						
									
						帖子
					
								由 freelikewind » 
			
			
			
			
			
			windy 写了: 昨天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
 
还没看这个新模型,不过tokenizer is vital。
tokenizer本身就是语言模型,永远不会低估它对语言处理的作用。
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 labi
- 论坛元老
  
- 帖子互动: 587
- 帖子: 18054
- 注册时间: 2022年 8月 3日 11:08
 
	 
	                                        			
		
		
			- 
				
								jb(Joe Biden)							
- 论坛精英
  
- 帖子互动: 267
- 帖子: 5365
- 注册时间: 2024年 6月 23日 19:23
						
					
													
							
						
									
						帖子
					
								由 jb(Joe Biden) » 
			
			
			
			
			
			
			
			
			
						
						
							Joe Biden Says He Needs More Sleep and Less Work at Night.
夜晚多睡觉,少干活。
			
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
windy 写了: 昨天 08:12
看了下,显然是Deepseek在模型的能力上拼不过,改打这种小trick来抓眼球。这种东西有用吗?有。但是用处不大。类似的东西,包括多态模型,现在研究的多了。产品也多如牛毛。几个主打的大语言模型(其实这些都早不仅仅是“语言”模型了)都支持多模态输入。DS作为产品的卖点可以理解,从创新角度上真没啥好吹的
 
	
					x1
							 
				 
	
 
						
						
										
						 
		 
				
		
		 
	 
	                
                                    			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			这个东西的意义不在于OCR,而是提出了同时搞定GPT两个致命缺陷的办法
- tokenizer
- 长context降智
jb 写了: 昨天 09:14
DeepSeek-OCR准确率97%还是太低。
 
	
					x1
							 
				 
	
 
						
						
										
						 
		 
				
		
		 
	 
	                                
                    			
		
		
			- 
				
																			 FGH
- 论坛精英
  
- 帖子互动: 107
- 帖子: 7081
- 注册时间: 2022年 7月 25日 16:30
						
					
													
							
						
									
						帖子
					
								由 FGH » 
			
			
			
			
			
			DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 windy(文帝)
- 著名点评
  
- 帖子互动: 1027
- 帖子: 5207
- 注册时间: 2023年 2月 7日 18:53
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
xiaoju 写了: 昨天 09:30
你又急的不懂装懂了。。。
openai的scaling law早就撞墙了,最近一年什么成果也没搞出来。人类的希望就看deepseek了
 
	
					x3
							 
				 
	
 
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 DQQ
- 论坛精英
  
- 帖子互动: 156
- 帖子: 5354
- 注册时间: 2023年 1月 4日 16:17
 
	 
	                                        			
		
		
			- 
				
																			 sgisp2
- 著名点评
  
- 帖子互动: 138
- 帖子: 4829
- 注册时间: 2022年 7月 25日 01:12
						
					
													
							
						
									
						帖子
					
								由 sgisp2 » 
			
			
			
			
			
			DeepSeek是不是落后难讲,但是在创新维度上应该是远超美国那几个只能吃“菠菜”的大力水手滴!
就看R2是什么王炸啦
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
windy 写了: 昨天 10:30
插,说到不懂装懂,有谁比得上你这个在日本国的卢瑟啊。
现在各家确实都没啥大突破,但是DS在基本层面上已经落后了。编程现在是Claude,普通对话还是Chatgpt独领风骚。tokenizer本质上是prompt engineering的一部分,不光几大巨头在搞,很多不大不小的公司也在搞。DS搞的这种也就是雕虫小技。还敢吹成人类希望,也就你这种待在本子这种小国,没见过世面的才会说出这种疯话。
 
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			你胡扯之前先上AI过一遍不行么?
FGH 写了: 昨天 09:38
DS以前一直被诟病缺乏多模态能力。这次算是补上了短板。是不是弯道超车了?再等等看。
 
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 coltzhao(bigdumbdumpling)
- 论坛点评
  
- 帖子互动: 115
- 帖子: 2047
- 注册时间: 2022年 8月 1日 01:01
						
					
													
							
						
									
						帖子
					
								由 coltzhao(bigdumbdumpling) » 
			
			
			
			
			
			jb 写了: 昨天 09:14
DeepSeek-OCR准确率97%还是太低。
 
人类就是大概98%
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 windy(文帝)
- 著名点评
  
- 帖子互动: 1027
- 帖子: 5207
- 注册时间: 2023年 2月 7日 18:53
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			狗子屁都不懂,坐在井里觉得井好大
xiaoju 写了: 昨天 18:06
尼玛,“tokenizer本质上是prompt engineering的一部分”
狗子急的脱粪了
 
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 4n4ly
- 著名写手
  
- 帖子互动: 23
- 帖子: 327
- 注册时间: 2025年 4月 15日 10:38
						
					
													
							
						
									
						帖子
					
								由 4n4ly » 
			
			
			
			
			
			还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
 
		 
				
		
		 
	 
	                        
                            			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			你个傻逼甚至不懂让AI给你纠正一下
windy 写了: 昨天 18:13
狗子屁都不懂,坐在井里觉得井好大
 
 
		 
				
		
		 
	 
	                                        
            			
		
		
			- 
				
																			 xiaoju(可爱的龙猫)
- 论坛元老
  
- 帖子互动: 1121
- 帖子: 26618
- 注册时间: 2023年 9月 5日 20:18
						
					
													
							
						
									
						帖子
					
								由 xiaoju(可爱的龙猫) » 
			
			
			
			
			
			我举个例子说明一下:
现在的LLM的输入,是单词的词典编号
而deepseek-ocr的输入,是单词的图形
对于人类来说,记住图形更容易和省力,deepseek发现对于电脑也是一样
4n4ly 写了: 昨天 18:15
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
 
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 windy(文帝)
- 著名点评
  
- 帖子互动: 1027
- 帖子: 5207
- 注册时间: 2023年 2月 7日 18:53
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			你要懂点信息论就不会觉得反直觉了。
4n4ly 写了: 昨天 18:15
还真是有点反直觉,一张报纸的图片,按这个模型压缩后的大小比图片ocr转成文字的大小还小很多, 理解的对不对?
 
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 windy(文帝)
- 著名点评
  
- 帖子互动: 1027
- 帖子: 5207
- 注册时间: 2023年 2月 7日 18:53
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			其实从LLM来说,即使是几百个Billion的参数,和用来训练的数据里面包含的信息量相比,其实是非常小了。
 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			 tootsie
- 著名点评
  
- 帖子互动: 180
- 帖子: 3817
- 注册时间: 2022年 7月 25日 21:08