分页: 3 / 4
Re: 说一下 NAS
发表于 : 2024年 1月 8日 14:08
由 tend
constableOne 写了: 2024年 1月 8日 13:33
试master pdf editor; 看看bookmarks 在pdf 里面是不是你要的。但scan -> pdf 是一步到位。scanner driver has to be installed first.
你说的这个不是我要的功能。我的scanner能直接扫描成PDF到NAS。通常扫描的PDF都不是searchable的,需要OCR软件转换一下。转换成searchable的后,只是在文件内可搜索,比如在PDF reader里面搜索。要做到搜索某个文件夹下面的所有PDF文件中的某个关键词并找出那个文件包含这个关键词,这个是我想要的。
Re: 说一下 NAS
发表于 : 2024年 1月 8日 14:22
由 constableOne
tend 写了: 2024年 1月 8日 14:08
你说的这个不是我要的功能。我的scanner能直接扫描成PDF到NAS。通常扫描的PDF都不是searchable的,需要OCR软件转换一下。转换成searchable的后,只是在文件内可搜索,比如在PDF reader里面搜索。要做到搜索某个文件夹下面的所有PDF文件中的某个关键词并找出那个文件包含这个关键词,这个是我想要的。
呵,误会了。把pdf变成postscript, 然后search postscript?我是异想天开了。当年的report 是从postscript到pdf, 累的活留给能干的人做哈。
Re: 说一下 NAS
发表于 : 2024年 1月 8日 14:32
由 tend
constableOne 写了: 2024年 1月 8日 14:22
呵,误会了。把pdf变成postscript, 然后search postscript?我是异想天开了。当年的report 是从postscript到pdf, 累的活留给能干的人做哈。
一个是从文件里面搜关键词,一个是从关键词找出文件。
Re: 说一下 NAS
发表于 : 2024年 1月 8日 14:38
由 constableOne
tend 写了: 2024年 1月 8日 14:32
一个是从文件里面搜关键词,一个是从关键词找出文件。
ocrmypdf, can it work to your satisfaction?
Re: 说一下 NAS
发表于 : 2024年 1月 8日 14:48
由 tend
constableOne 写了: 2024年 1月 8日 14:38
ocrmypdf, can it work to your satisfaction?
这个是第一步,先把扫描的PDF转化成searchable的。我就是用ocrmypdf做这个工作的,让NAS自动做。第二步是建索引,可以通过网页搜索文件。
Re: 说一下 NAS
发表于 : 2024年 1月 8日 15:10
由 constableOne
tend 写了: 2024年 1月 8日 14:48
这个是第一步,先把扫描的PDF转化成searchable的。我就是用ocrmypdf做这个工作的,让NAS自动做。第二步是建索引,可以通过网页搜索文件。
今天又学到新东西了!
ocrmypdf 盯着一个directory, 一有 pdf 进去,produce a searchable version in a different directory;
用 flask 做 web services, html/javascript get keyword, call web service -> pdfgrep, post results back to the page;
爽!
Re: 说一下 NAS
发表于 : 2024年 1月 11日 23:40
由 mrmaja
constableOne 写了: 2024年 1月 8日 15:10
今天又学到新东西了!
ocrmypdf 盯着一个directory, 一有 pdf 进去,produce a searchable version in a different directory;
用 flask 做 web services, html/javascript get keyword, call web service -> pdfgrep, post results back to the page;
爽!
NAS那个photo app能识别人脸,却不能做到像iphone photo的search那样可以搜任何照片里的文字?感觉应该不难啊,
叔现在所以纸质文档都拍照存在ipad里,都懒得转pdf了,就是因为搜索方便
Re: 说一下 NAS
发表于 : 2024年 1月 23日 23:34
由 JoshuaShaw
要啥NAS,买台Dell 730再搞个机柜不香吗?12个3.5寸盘位 + 2个2.5寸盘位。CPU内存便宜的一比,要是有兴趣再去搞个4块P4显卡。这个不比什么NAS强?装个Rocky Linux 9,绝对秒杀任何NAS。尤其是垃圾NAS
Re: 说一下 NAS
发表于 : 2024年 1月 23日 23:37
由 YouHi
JoshuaShaw 写了: 2024年 1月 23日 23:34
要啥NAS,买台Dell 730再搞个机柜不香吗?12个3.5寸盘位 + 2个2.5寸盘位。CPU内存便宜的一比,要是有兴趣再去搞个4块P4显卡。这个不比什么NAS强?装个Rocky Linux 9,绝对秒杀任何NAS。尤其是垃圾NAS
省电啊。。。730耗电超多。且噪音巨大。
Re: 说一下 NAS
发表于 : 2024年 1月 24日 00:12
由 ferrygao
qnap加个2.5g网卡 秒翻倍
Re: 说一下 NAS
发表于 : 2024年 1月 24日 00:27
由 JoshuaShaw
YouHi 写了: 2024年 1月 23日 23:37
省电啊。。。730耗电超多。且噪音巨大。
又没有啥计算任务。200W撑死了,一般情况150W。150W一个月能有多少钱?买机柜,两边做上玻璃门。门一关,不要放卧室,放到车库去,一点毛病都没有。
Re: 说一下 NAS
发表于 : 2024年 1月 24日 00:30
由 ferrygao
200w 靠 加州一年要400刀了吧
Re: 说一下 NAS
发表于 : 2024年 1月 24日 00:43
由 JoshuaShaw
ferrygao 写了: 2024年 1月 24日 00:30
200w 靠 加州一年要400刀了吧
实际平均算也就是150W而已,你要嫌贵,少上一块CPU,少上几块硬盘,100W也就这样了。如果按100W算,一个月17刀很贵吗?400/年,上满CPU和硬盘都到不了的。上满不过一个月24刀/月而已。再说了,您都住加州了。还在乎这几个电钱?
Re: 说一下 NAS
发表于 : 2024年 1月 24日 01:08
由 YouHi
JoshuaShaw 写了: 2024年 1月 24日 00:27
又没有啥计算任务。200W撑死了,一般情况150W。150W一个月能有多少钱?买机柜,两边做上玻璃门。门一关,不要放卧室,放到车库去,一点毛病都没有。
我用Synology DS218+。貌似<20W。
另加一个i5-10400 32GB的Acer台式机。跑Proxmox,里面跑好几个VM加LXC,其中包括pfSense。耗电35W。
关键是我对噪音敏感。Synology几乎无声。Acer平时也没声音。我跑ffmpeg convert video时候会嚎叫几分钟。
Re: 说一下 NAS
发表于 : 2024年 1月 24日 01:17
由 tend
JoshuaShaw 写了: 2024年 1月 24日 00:43
实际平均算也就是150W而已,你要嫌贵,少上一块CPU,少上几块硬盘,100W也就这样了。如果按100W算,一个月17刀很贵吗?400/年,上满CPU和硬盘都到不了的。上满不过一个月24刀/月而已。再说了,您都住加州了。还在乎这几个电钱?
你这个思路不对。如果不在乎一年400刀电钱,你也没必要搞这个系统,买商业化服务就行。
另外,你这个高耗电系统并不比别人的20瓦nas有更多的功能
Re: 说一下 NAS
发表于 : 2024年 1月 24日 01:35
由 JoshuaShaw
tend 写了: 2024年 1月 24日 01:17
你这个思路不对。如果不在乎一年400刀电钱,你也没必要搞这个系统,买商业化服务就行。
另外,你这个高耗电系统并不比别人的20瓦nas有更多的功能
拜托!3.5寸盘,一块就10瓦了,你用啥系统有20瓦的NAS?不算硬盘的话能做到!你的20瓦,我的服务器也不过30W而已。我们现在讨论的是12块硬盘的NAS,怕费电,别上那么多硬盘就好了。都以为服务器费电,你有没有实际测试过?其实服务器费的电对得起他的能力。单位能耗不会比你那个20W的NAS差的。R730的服务器你上一块E5-2620的CPU,只上8G内存,1块硬盘,你看看才几个电?大主板和小主板比,能多浪费5W吗?其实只要大家硬件水平差不多,服务器未必会比普通NAS更加搞耗能。CPU的制程水平是费不费电的核心。只要制程水平一致,每平方毫米的二级管用的电没那么大差别的。服务器放机房,机房的成本里电费就是大头。没有能源效率的服务器其实没人买。所以别以为服务器有多费电。
Re: 说一下 NAS
发表于 : 2024年 1月 24日 01:36
由 JoshuaShaw
12V 2A就24W了。真的以为小NAS省电吗?
Re: 说一下 NAS
发表于 : 2024年 1月 24日 06:49
由 ferrygao
allin服务器 浪费资源是人类永恒的追求
Re: 说一下 NAS
发表于 : 2024年 1月 24日 08:58
由 tend
JoshuaShaw 写了: 2024年 1月 24日 01:35
拜托!3.5寸盘,一块就10瓦了,你用啥系统有20瓦的NAS?不算硬盘的话能做到!你的20瓦,我的服务器也不过30W而已。我们现在讨论的是12块硬盘的NAS,怕费电,别上那么多硬盘就好了。都以为服务器费电,你有没有实际测试过?其实服务器费的电对得起他的能力。单位能耗不会比你那个20W的NAS差的。R730的服务器你上一块E5-2620的CPU,只上8G内存,1块硬盘,你看看才几个电?大主板和小主板比,能多浪费5W吗?其实只要大家硬件水平差不多,服务器未必会比普通NAS更加搞耗能。CPU的制程水平是费不费电的核心。只要制程水平一致,每平方毫米的二级管用的电没那么大差别的。服务器放机房,机房的成本里电费就是大头。没有能源效率的服务器其实没人买。所以别以为服务器有多费电。
看看我的NAS用电统计

Re: 说一下 NAS
发表于 : 2024年 1月 24日 13:28
由 helloguys
JoshuaShaw 写了: 2024年 1月 24日 01:36
12V 2A就24W了。真的以为小NAS省电吗?
哪个硬盘 12V 2A,晒出来让大家开开眼界。
3.5" 机械硬盘 12V 的额定电流都是毫安级的。这还只是“额定”,实际电流只会低于这个数,不会高于。这还没有考虑 spin down / idle / hibernate 的情况。