如烟导航
  • 首页
  • QQ群
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI开源项目

      共 97 篇网址
      愿你三冬暖站长工具影视整合装机工具开发工具小说听书漫画软件源游戏源办公工具资源整合学习网站AI工具AI 大模型在线工具
      AI大语言模型AI行业大模型AI编程工具AI开源项目AI开发框架AI开放平台AI应用接口APIAI基础设施
      排序
      发布更新浏览点赞
      GOT-OCR2.0

      GOT-OCR2.0

      创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。
      790
      AI开源项目# AI开源项目# 交互式OCR# 光学字符识别
      MinerU

      MinerU

      一个功能强大的PDF内容提取工具,通过其多模态内容处理、结构和格式保留、公式识别与转换、干扰元素去除、乱码识别与处理以及高质量解析工具链等主要功能,能够高效地从PDF文档中...
      790
      AI开源项目# AI开源项目
      OmniParser

      OmniParser

      一个创新的屏幕解析工具,它通过与先进的视觉语言模型结合,显著提升了智能代理在用户界面中的操作能力
      790
      AI开源项目# AI开源项目
      GPT-SoVITS

      GPT-SoVITS

      一个功能强大的开源声音克隆项目,它通过创新的少量样本学习技术,使得用户能够快速训练出高质量的文本到语音模型
      790
      AI开源项目# AI开源项目
      StarCoder 2

      StarCoder 2

      一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
      780
      AI开源项目# AI开源项目# AI编程# 代码理解
      NotebookLlama

      NotebookLlama

      Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成
      780
      AI开源项目# AI开源项目
      Fluid

      Fluid

      一个创新的文本到图像生成模型,通过使用连续标记和随机生成顺序,显著提高了图像生成的质量和性能
      780
      AI开源项目# AI开源项目
      MetaGPT

      MetaGPT

      一个创新的多智能体编程框架,它通过模拟人类工作流程和采用标准化操作程序来提高代码生成的质量和效率。该框架特别适合解决复杂的软件开发任务,并为自动化编程和多智能体协作提...
      770
      AI开源项目# AI开源项目# 代码生成# 元编程框架
      EMO

      EMO

      一个创新的音频驱动肖像视频生成工具,凭借其简单的输入方式、丰富的表情生成能力、多语言支持以及对多种肖像风格的兼容性
      770
      AI开源项目# AI开源项目
      Draw an Audio

      Draw an Audio

      创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。
      760
      AI开源项目# AI开源项目# 人工智能# 声音设计
      Vary-toy

      Vary-toy

      一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能。
      760
      AI开源项目# AI开源项目# 图像描述# 多模态交互
      DiffusionGPT

      DiffusionGPT

      一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。
      760
      AI开源项目# AI开源项目# 人类反馈优化# 优势数据库
      Swarm

      Swarm

      Swarm是一个由OpenAI解决方案团队管理的教育框架,旨在探索轻量级、易于使用的多智能体编排技术。
      760
      AI开源项目# AI开源项目
      PhotoMaker V2

      PhotoMaker V2

      一个功能强大、操作简便的 AI 图像生成工具,它通过深度学习技术实现了快速、高质量的逼真人物图像生成。该工具不仅在技术上实现了突破,还在应用场景上展现了广泛的潜力,无论是...
      750
      AI开源项目# AI图像生成# AI开源项目# GANs技术
      ConsiStory

      ConsiStory

      它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
      750
      AI开源项目# AI开源项目
      FunAudioLLM

      FunAudioLLM

      由阿里巴巴集团通义语音团队开发的框架,旨在增强人类与大型语言模型(LLMs)之间的自然语音交互
      750
      AI开源项目# AI开源项目
      Boximator

      Boximator

      强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。
      740
      AI开源项目# AI开源项目# 交互式视频# 人工智能
      Real-ESRGAN

      Real-ESRGAN

      一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。
      730
      AI开源项目# AI开源项目# GAN技术# U-Net判别器
      VideoPoet

      VideoPoet

      强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。
      730
      AI开源项目# AI开源项目# AI视频合成# Transformer架构
      Roop

      Roop

      一个功能强大的换脸工具,以其简单易用和高性能的特点,为用户提供了一种便捷的方式来实现视频中的面孔替换
      730
      AI开源项目# AI开源项目
      EasyAnimate

      EasyAnimate

      基于Transformer架构的视频生成工具,提供了高效、灵活的视频生成解决方案
      730
      AI开源项目# AI开源项目
      DeepTranslate

      DeepTranslate

      一款功能强大、使用便捷的免费AI双语页面翻译浏览器插件。它支持多种语言和翻译API,能够满足用户在不同场景下的翻译需求
      730
      AI开源项目# AI开源项目# AI浏览器插件
      abab-music-1

      abab-music-1

      一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。
      720
      AI开源项目# AI开源项目# AI音乐生成# 业余音乐制作
      GPT-SoVITS

      GPT-SoVITS

      一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。
      710
      AI开源项目# AI开源项目# 个性化助手# 人工智能
      DreaMoving

      DreaMoving

      一个强大的视频生成框架,通过其创新的Video ControlNet和Content Guider,实现了对视频内容的高度控制
      710
      AI开源项目# AI开源项目
      SUPIR

      SUPIR

      一款功能强大且多用途的图像恢复工具,它通过结合AI技术和文本驱动的智能恢复,能够为用户提供高保真度的图像恢复服务
      700
      AI开源项目# AI开源项目
      Seed-VC

      Seed-VC

      一个创新的声音转换工具,它通过零样本学习技术,能够在不需要特定目标音色样本的情况下实现高质量的声音转换
      680
      AI开源项目# AI开源项目
      书生·物华2.0(3DTopia 2.0)

      书生·物华2.0(3DTopia 2.0)

      采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。
      670
      AI开源项目# AI开源项目
      JoyHallo

      JoyHallo

      一个功能强大的数字人模型,专注于普通话和英语的音频驱动视频生成。它通过优化模型结构和数据集支持,实现了高效的跨语言生成能力,并在推理速度和准确性上表现出色
      660
      AI开源项目# AI开源项目
      MMMLU

      MMMLU

      重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
      650
      AI开源项目# AI开源项目# AI模型评估# 国际化业务
      加载更多
      Copyright © 2025 如烟导航 

       豫ICP备2024076496号

       
      ×
      收藏本站!
      希望您能通过知乎、公众号、简书、豆瓣、抖音、微博、微信、个人网站等媒介告诉身边朋友进站必读

      • 如烟笔记如烟笔记
      • 花瓣花瓣
      • 可画设计可画设计
      • 喜马拉雅喜马拉雅
      • 小红书小红书
      • 抖音抖音

      • 添加应用添加应用
      • 关闭折叠dock栏
      • 网站提交网站提交
      ×

      添加应用

      添加后右键点击即可删除







      确定删除该应用吗?

      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍