问题背景:需要读取大约500万行,2个字段的表,然后计算出一个同等记录行数结果集,都用dataframe下载、计算、并上传到Dataphin上,现在性能瓶颈在下载数据(需要3分钟)和上传数据(需要10分钟),计算只需要2分钟完成。 def write_records(session_id, block_id): local ...