Collections.shuffle方法可以用于大数据集合,但是需要注意的是,这个方法是在原集合上进行操作的,所以如果数据量过大可能会导致性能问题或者内存溢出。在处理大数据集合时,最好先将数据分块处理,然后分别对每个小块进行shuffle操作,以避免出现性能问题。另外,也可以考虑使用并行处理或者其他优化方法来提高shuffle操作的性能。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:collections.shuffle能保证数据随机吗