AnimateDiff
通过预训练的运动建模模块,使得用户能够轻松地创作出丰富多样的动画内容,同时保持了原有模型的风格和特性。它的跨领域应用性和易于集成的特点,极大地扩展了个性化动画的创作空间。
一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。

ScreenAgent是由吉林大学人工智能学院与知识驱动的人工智能教育部工程研究中心联合开发的一个基于视觉语言模型(VLM)的计算机控制智能体。该智能体能够与真实计算机屏幕进行交互,执行多步骤任务。
ScreenAgent是一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。ScreenAgent的控制流程和评估指标使其成为一个强大的工具,可用于自动化各种数字任务,提高效率和便利性。