试master pdf editor; 看看bookmarks 在pdf 里面是不是你要的。但scan -> pdf 是一步到位。scanner driver has to be installed first.tend 写了: 2024年 1月 8日 13:27 6. 网上有很多app从找到scanner, preview, scanner, pdf 一键全做
这些是怎么做的?我以前做过功课,似乎没找到我想要的这个功能。
我的要求是把所有想保存的文档送到scanner,当有一天我想找某个文档时可以用关键词搜出来。搜索界面类似google search,搜索结果有一些preview information,并有文件的连接。
说一下 NAS
版主: Jack12345
#41 Re: 说一下 NAS
#42 Re: 说一下 NAS
你说的这个不是我要的功能。我的scanner能直接扫描成PDF到NAS。通常扫描的PDF都不是searchable的,需要OCR软件转换一下。转换成searchable的后,只是在文件内可搜索,比如在PDF reader里面搜索。要做到搜索某个文件夹下面的所有PDF文件中的某个关键词并找出那个文件包含这个关键词,这个是我想要的。constableOne 写了: 2024年 1月 8日 13:33 试master pdf editor; 看看bookmarks 在pdf 里面是不是你要的。但scan -> pdf 是一步到位。scanner driver has to be installed first.
#43 Re: 说一下 NAS
呵,误会了。把pdf变成postscript, 然后search postscript?我是异想天开了。当年的report 是从postscript到pdf, 累的活留给能干的人做哈。tend 写了: 2024年 1月 8日 14:08 你说的这个不是我要的功能。我的scanner能直接扫描成PDF到NAS。通常扫描的PDF都不是searchable的,需要OCR软件转换一下。转换成searchable的后,只是在文件内可搜索,比如在PDF reader里面搜索。要做到搜索某个文件夹下面的所有PDF文件中的某个关键词并找出那个文件包含这个关键词,这个是我想要的。
#44 Re: 说一下 NAS
一个是从文件里面搜关键词,一个是从关键词找出文件。constableOne 写了: 2024年 1月 8日 14:22 呵,误会了。把pdf变成postscript, 然后search postscript?我是异想天开了。当年的report 是从postscript到pdf, 累的活留给能干的人做哈。
#47 Re: 说一下 NAS
今天又学到新东西了!tend 写了: 2024年 1月 8日 14:48 这个是第一步,先把扫描的PDF转化成searchable的。我就是用ocrmypdf做这个工作的,让NAS自动做。第二步是建索引,可以通过网页搜索文件。
ocrmypdf 盯着一个directory, 一有 pdf 进去,produce a searchable version in a different directory;
用 flask 做 web services, html/javascript get keyword, call web service -> pdfgrep, post results back to the page;
爽!
#48 Re: 说一下 NAS
NAS那个photo app能识别人脸,却不能做到像iphone photo的search那样可以搜任何照片里的文字?感觉应该不难啊,constableOne 写了: 2024年 1月 8日 15:10 今天又学到新东西了!
ocrmypdf 盯着一个directory, 一有 pdf 进去,produce a searchable version in a different directory;
用 flask 做 web services, html/javascript get keyword, call web service -> pdfgrep, post results back to the page;
爽!
叔现在所以纸质文档都拍照存在ipad里,都懒得转pdf了,就是因为搜索方便
#49 Re: 说一下 NAS
要啥NAS,买台Dell 730再搞个机柜不香吗?12个3.5寸盘位 + 2个2.5寸盘位。CPU内存便宜的一比,要是有兴趣再去搞个4块P4显卡。这个不比什么NAS强?装个Rocky Linux 9,绝对秒杀任何NAS。尤其是垃圾NAS
#50 Re: 说一下 NAS
省电啊。。。730耗电超多。且噪音巨大。JoshuaShaw 写了: 2024年 1月 23日 23:34 要啥NAS,买台Dell 730再搞个机柜不香吗?12个3.5寸盘位 + 2个2.5寸盘位。CPU内存便宜的一比,要是有兴趣再去搞个4块P4显卡。这个不比什么NAS强?装个Rocky Linux 9,绝对秒杀任何NAS。尤其是垃圾NAS
#54 Re: 说一下 NAS
实际平均算也就是150W而已,你要嫌贵,少上一块CPU,少上几块硬盘,100W也就这样了。如果按100W算,一个月17刀很贵吗?400/年,上满CPU和硬盘都到不了的。上满不过一个月24刀/月而已。再说了,您都住加州了。还在乎这几个电钱?
#55 Re: 说一下 NAS
我用Synology DS218+。貌似<20W。JoshuaShaw 写了: 2024年 1月 24日 00:27 又没有啥计算任务。200W撑死了,一般情况150W。150W一个月能有多少钱?买机柜,两边做上玻璃门。门一关,不要放卧室,放到车库去,一点毛病都没有。
另加一个i5-10400 32GB的Acer台式机。跑Proxmox,里面跑好几个VM加LXC,其中包括pfSense。耗电35W。
关键是我对噪音敏感。Synology几乎无声。Acer平时也没声音。我跑ffmpeg convert video时候会嚎叫几分钟。
#56 Re: 说一下 NAS
你这个思路不对。如果不在乎一年400刀电钱,你也没必要搞这个系统,买商业化服务就行。JoshuaShaw 写了: 2024年 1月 24日 00:43 实际平均算也就是150W而已,你要嫌贵,少上一块CPU,少上几块硬盘,100W也就这样了。如果按100W算,一个月17刀很贵吗?400/年,上满CPU和硬盘都到不了的。上满不过一个月24刀/月而已。再说了,您都住加州了。还在乎这几个电钱?
另外,你这个高耗电系统并不比别人的20瓦nas有更多的功能
#57 Re: 说一下 NAS
拜托!3.5寸盘,一块就10瓦了,你用啥系统有20瓦的NAS?不算硬盘的话能做到!你的20瓦,我的服务器也不过30W而已。我们现在讨论的是12块硬盘的NAS,怕费电,别上那么多硬盘就好了。都以为服务器费电,你有没有实际测试过?其实服务器费的电对得起他的能力。单位能耗不会比你那个20W的NAS差的。R730的服务器你上一块E5-2620的CPU,只上8G内存,1块硬盘,你看看才几个电?大主板和小主板比,能多浪费5W吗?其实只要大家硬件水平差不多,服务器未必会比普通NAS更加搞耗能。CPU的制程水平是费不费电的核心。只要制程水平一致,每平方毫米的二级管用的电没那么大差别的。服务器放机房,机房的成本里电费就是大头。没有能源效率的服务器其实没人买。所以别以为服务器有多费电。tend 写了: 2024年 1月 24日 01:17 你这个思路不对。如果不在乎一年400刀电钱,你也没必要搞这个系统,买商业化服务就行。
另外,你这个高耗电系统并不比别人的20瓦nas有更多的功能
#58 Re: 说一下 NAS
12V 2A就24W了。真的以为小NAS省电吗?
#60 Re: 说一下 NAS
看看我的NAS用电统计JoshuaShaw 写了: 2024年 1月 24日 01:35 拜托!3.5寸盘,一块就10瓦了,你用啥系统有20瓦的NAS?不算硬盘的话能做到!你的20瓦,我的服务器也不过30W而已。我们现在讨论的是12块硬盘的NAS,怕费电,别上那么多硬盘就好了。都以为服务器费电,你有没有实际测试过?其实服务器费的电对得起他的能力。单位能耗不会比你那个20W的NAS差的。R730的服务器你上一块E5-2620的CPU,只上8G内存,1块硬盘,你看看才几个电?大主板和小主板比,能多浪费5W吗?其实只要大家硬件水平差不多,服务器未必会比普通NAS更加搞耗能。CPU的制程水平是费不费电的核心。只要制程水平一致,每平方毫米的二级管用的电没那么大差别的。服务器放机房,机房的成本里电费就是大头。没有能源效率的服务器其实没人买。所以别以为服务器有多费电。
