本项目旨在提供一个用于大模型数据合成的开源工具箱。通过该工具箱提供的多种数据合成方法,用户可以高效地构建适用于不同业务需求的数据管道流程,从而显著提高数据生产效率。在数据构建完成后,工具箱还支持从语义和实体等多个层面对数据的多样性 ...