OASIS

仅用5M数据超过 OpenAI?快手最新 Code Embedding 模型 OASIS(绿洲)发布

出品 | 51CTO技术栈(微信号:blog51cto)最近,快手Kwaipilot 团队正式宣布开源 OASIS(Optimized Augmentation Strategy for Improved code Search)Code Embedding模型。 快手 Kwaipilot 团队在代码表征领域实现了突破性进展,仅仅使用 5M Tokens数据大幅领先 OpenAI,在多个 Code Search benchmark 中显著超越现有最佳水平。 1.什么是代码表征?随着代码库规模的持续扩大,开发者越来越依赖高效的代码检索系统来提升开发效率。
  • 1