AI开源项目

共 97 篇网址

EchoMimic

一个强大的音频驱动肖像动画生成工具，它通过创新的训练策略和多驱动方式，能够在多种场景下生成高质量、逼真的肖像动画

2650

AI开源项目 # AI开源项目

DiT

创新的图像生成模型，它通过结合扩散模型和Transformer架构，实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。

2630

AI开源项目 # AI开源项目 # Transformer架构 # 上下文条件

Make-A-Character

创新的3D角色生成框架，它通过文本描述快速创建逼真的3D角色，具有高度的定制性和逼真度。它结合了最新的人工智能技术，提供了一个直观、灵活且高效的角色创建解决方案，适用于多...

2610

AI开源项目 # 3D建模 # AI开源项目 # CG技术

Boximator

强大的视频合成工具，它通过创新的框约束机制和自跟踪技术，实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。

2610

AI开源项目 # AI开源项目 # 交互式视频 # 人工智能

AtomoVideo

一个创新的图像到视频生成框架，它通过先进的技术和灵活的架构，为用户提供了一种从静态图像生成高保真视频的新方法

2610

AI开源项目 # AI开源项目

Depth Anything

强大的单目深度估计工具，它通过利用大规模未标注数据和先进的数据增强技术，实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。

2600

AI开源项目 # 3D建模 # AI开源项目 # AR/VR融合

PhotoMaker V2

一个功能强大、操作简便的 AI 图像生成工具，它通过深度学习技术实现了快速、高质量的逼真人物图像生成。该工具不仅在技术上实现了突破，还在应用场景上展现了广泛的潜力，无论是...

2590

AI开源项目 # AI图像生成 # AI开源项目 # GANs技术

Outfit Anyone

一个创新的AI服装虚拟试穿工具，它通过智能技术为用户和模特提供了一种全新的服装试穿体验。无论是消费者、设计师、模特还是电商从业者，都可以利用这个工具来探索和展示服装，为...

2580

AI开源项目 # AI开源项目 # AI试衣间 # 个性化推荐

cogvlm2-llama3-caption

强大的视频描述生成工具，通过先进的多模态处理和上下文感知能力，为用户提供了一种快速理解视频内容的方法。它的实时处理能力和定制化描述功能，使其在多种应用场景中都非常有用。

2580

AI开源项目 # AI开源项目

IP-Adapter

一个强大的工具，它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效，易于部署和使用，同时支持广泛的应用场景，包括图像生成、转换和修复。通过解耦的交叉...

2580

AI开源项目 # AI开源项目 # 图像生成 # 图像编码

MetaGPT

一个创新的多智能体编程框架，它通过模拟人类工作流程和采用标准化操作程序来提高代码生成的质量和效率。该框架特别适合解决复杂的软件开发任务，并为自动化编程和多智能体协作提...

2560

AI开源项目 # AI开源项目 # 代码生成 # 元编程框架

ConsiStory

它提供了一种快速、高效且训练无关的方法来生成一致性图像，特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景，还能够应对多主题挑战，并与现有的图像编辑工具...

2560

AI开源项目 # AI开源项目

Swarm

Swarm是一个由OpenAI解决方案团队管理的教育框架，旨在探索轻量级、易于使用的多智能体编排技术。

2560

AI开源项目 # AI开源项目

PDF2Audio

通过将PDF文档转换成音频内容，为用户提供了一种新的信息消费方式。无论是教育、播客制作还是无障碍访问，PDF2Audio都能满足多样化的需求。

2550

AI开源项目 # AI开源项目 # PDF转音频 # 信息消费

GameNGen

由谷歌推出的世界首个完全由AI驱动的游戏引擎，旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面，无需手动编写代码

2550

AI开源项目 # AI开源项目

StoryMaker

通过先进的 AI 技术，为创作者提供了一种生成具有高度一致性和个性化特征的图像序列的方法，特别适合需要角色和场景连贯性的创意项目

2530

AI开源项目 # AI开源项目 # LoRA技术 # 个性化图像

SFR-RAG

先进的大型语言模型，它通过强化对上下文的理解，提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域，SFR-RAG都能提供高质量的文...

2530

AI开源项目 # AI开源项目 # 上下文理解 # 函数调用

SUPIR

一款功能强大且多用途的图像恢复工具，它通过结合AI技术和文本驱动的智能恢复，能够为用户提供高保真度的图像恢复服务

2530

AI开源项目 # AI开源项目

Void

它通过集成AI功能，为用户提供了一个高效、智能的编程和文本编辑环境。无论是代码开发还是文本编辑，Void都能提供强大的支持和便捷的操作。

2520

AI开源项目 # AI开源项目 # AI集成 # VS Code分支

onewebot2

易于使用的微信AI机器人软件包，它通过简化的配置流程和一键运行功能，使得用户能够快速启动和运行微信机器人。无论是个人还是企业，都能通过oneWebot2创建智能助手，实现自动化服务

2520

AI开源项目 # AI开源项目 # API集成 # 一键运行

Fluid

一个创新的文本到图像生成模型，通过使用连续标记和随机生成顺序，显著提高了图像生成的质量和性能

2510

AI开源项目 # AI开源项目

DiffusionGPT

一个创新的文本到图像生成系统，它通过结合大语言模型的解析能力和领域专家模型的生成能力，实现了从多样化文本提示到高质量图像的高效转换。

2500

AI开源项目 # AI开源项目 # 人类反馈优化 # 优势数据库

MIMO

创新的AI框架，它通过空间分解建模技术，提供了一种先进的可控角色视频合成方法。

2500

AI开源项目 # 3D感知合成 # AI开源项目 # AI框架

GOT-OCR2.0

创新的OCR模型，它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景，GOT-OCR 2.0都能提供强大的支持。

2500

AI开源项目 # AI开源项目 # 交互式OCR # 光学字符识别

TextDiffuser-2

一个功能强大的图像生成工具，它通过扩散模型技术，根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。

2490

AI开源项目 # AI图像生成 # AI开源项目 # 内容创造

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

2470

AI开源项目 # AI开源项目 # Transformer模型 # 多模态学习

DreaMoving

一个强大的视频生成框架，通过其创新的Video ControlNet和Content Guider，实现了对视频内容的高度控制

2460

AI开源项目 # AI开源项目

DDColor

用户可以轻松上传黑白图片，快速获得彩色结果，无论是对于修复老照片还是为动漫风景上色，DDColor都能提供令人满意的效果。

2440

AI开源项目 # AI图像着色 # AI开源项目 # 图像修复

Follow Your Pose

一个创新的文本到视频生成框架，它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频，还能让用户通过姿态序列精确控制视频中角色的动作...

2440

AI开源项目 # AI开源项目

GPT-SoVITS

一个功能强大的开源声音克隆项目，它通过创新的少量样本学习技术，使得用户能够快速训练出高质量的文本到语音模型

2440

AI开源项目 # AI开源项目

×

收藏本站！

希望您能通过知乎、公众号、简书、豆瓣、抖音、微博、微信、个人网站等媒介告诉身边朋友进站必读