Welcome to PaddleNLP

PaddleNLP 2.0 拥有覆盖多场景的模型库、简洁易用的全流程API与动静统一的高性能分布式训练能力,旨在为飞桨开发者提升文本领域建模效率,并提供基于PaddlePaddle 2.0的NLP领域最佳实践。具备如下特性:

  • 覆盖多场景的模型库

    • PaddleNLP集成了RNN与Transformer等多种主流模型结构,涵盖从词向量、词法分析、命名实体识别、语义表示等NLP基础技术,到文本分类、文本匹配、文本生成、文本图学习、信息抽取等NLP核心技术。同时针对机器翻译、通用对话、阅读理解等系统应用提供相应核心组件与预训练模型。

  • 简洁易用的全流程API

    • 深度兼容飞桨2.0的高层API体系,内置可复用的文本建模模块(Embedding、CRF、 Seq2Vec、Transformer),可大幅度减少在数据处理、模型组网、训练与评估、推理部署环节的开发量,提升NLP任务迭代与落地的效率。

  • 动静统一的高性能分布式训练

    • 基于飞桨2.0核心框架『动静统一』的特性与领先的混合精度优化策略,结合Fleet分布式训练API,可充分利用GPU集群资源,高效完成大规模预训练模型的分布式训练。

Indices and tables