我读取了大批量的论文到内存当中,然后又按照同名作者进行了分类,然后再对每一块论文根据相似度进行分块。最后再200w+的数据集上跑总是出现java heap space的错误,堆内存溢出。还出现过gc错误我读取了大批量的论文到内存当中,然后又按照同名作者进行了分类,然后再对每一块论文根据相似度进行
我读取了大批量的论文到内存当中,然后又按照同名作者进行了分类,然后再对每一块论文根据相似度进行分块。最后再200w+的数据集上跑总是出现java heap space的错误,堆内存溢出。还出现过gc错误我读取了大批量的论文到内存当中,然后又按照同名作者进行了分类,然后再对每一块论文根据相似度进行