您现在的位置:主页 > 业界 >

    中央编译社申请用于大规模文献集的索引优化与压缩存储系统及方法专利,提升大规模文献集的索引构建效率与存储压缩率

    时间:2025-08-16 08:36:28 阅读:

      国家知识产权局信息显示,中央编译出版社有限责任公司申请一项名为“用于大规模文献集的索引优化与压缩存储系统及方法”的专利,公开号CN120448472A,申请日期为2025年05月。

      专利摘要显示,本发明公开了用于大规模文献集的索引优化与压缩存储系统及方法,包括如下步骤:S1、文献数据采集与预处理,生成规范化文本数据集;S2、关键词语义向量编码,构建关键词语义向量矩阵;S3、初始高斯混合模型构建,得到聚类中心、协方差矩阵与权重;S4、引入海象优化算法优化聚类参数,输出最优聚类结果;S5、构建语义聚类结构,生成索引树结构;S6、位图压缩倒排编码,构建支持布尔逻辑的索引表;S7、新增文献动态接入,完成索引结构增量更新。本发明用于提升大规模文献集的索引构建效率与存储压缩率,实现高效、语义化和可增量更新的文献检索服务。

      天眼查资料显示,中央编译出版社有限责任公司,成立于2010年,位于北京市,是一家以从事新闻和出版业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,中央编译出版社有限责任公司共对外投资了2家企业,参与招投标项目34次,专利信息1条,此外企业还拥有行政许可3个。

      源自: