比如dataframe用DuckDB
画图用Plotly
各种工具要尽量和特定编程语言分离
版主: hci
#6 Re: 各种工具要尽量和特定编程语言分离
没多少
过去我是这么作的:读好几个CSV生成不同的dataframe,然后各种针对dataframe的计算,生成要回归和画图的dataframe。用R的时候需要data.table,用python的时候pandas,用julia的时候是充斥了 => 的dataframe。转换语言过一段时间再修改过去的代码就很麻烦了。
现在是:读好几个CSV生成duckdb的table, 然后运行SQL写的view进行计算,View存入duckdb,只有最终要回归和画图的才转换为dataframe,也只有这一步才跟程序语言有关。从头到尾都是SQL,怎么转换语言都没事。
画图也一样,Plotly是跨语言支持的,可以看着javasript的例子用Julia画图
x2

上次由 wokao 在 2024年 5月 14日 10:48 修改。
#8 Re: 各种工具要尽量和特定编程语言分离
最终的抽象可能还是要归一到自己的data上来,即:自己要定义一套完整的属于自己的data format,其它外界的工具format,对自己的format来说,就是插件,该转换就转换,该Pipe就pipe,这样自己的系统就有了相当的独立性,不会因为外界工具或编程语言改变,自己的系统被动地做出巨大调整。