北京师范大学人工智能学院

您的位置：首页» 公告及下载» 学院新闻

时间：2024-04-30 浏览：

2024年4月19日上午10：00,北京师范大学人工智能学院智能学术沙龙第二十二期在海淀校园成功举行。本次沙龙特邀微软亚洲研究院视觉计算组研究员古纾旸老师，为我们分享了“对视觉任务统一建模的探索”的主题报告。本次沙龙由张婷老师主持，现场座无虚席，大家积极参与，同老师认真讨论，收获良多，深受启发。

古老师从视觉模型在AI任务中的应用与挑战引出报告主题，主要探讨了模型构建、任务分配和训练数据收集三个方面的内容。同时，古老师也提到了如何将视觉任务转换为图像编辑任务，以及如何让模型更好地适应不同任务。

古老师随后讨论了视频任务中的几个典型问题。首先讨论如何将视频任务中的各个元素整合成一个明确的图像编辑，以便于后续的处理。其次，古老师就如何在数据收集、数据清洗和获取高质量数据方面进行优化展开论述。最后，老师强调了在构建数据时，要理解视觉信号和其他信号的关系，以及如何对对象进行替换和去除。

古老师还就图像替换与物体生成、模型优化与数据处理等进行技术探索，为同学们讲述了如何获取视觉数据，通过举例提取门的位置并将其替换成其他物体的例子，更加生动地让同学们明白了相关技术是如何工作的。

最后，古老师与学生们就学生提出的问题展开探索，对于视觉模型的选择与应用问题展开激烈讨论，主要讨论了视觉模型的切入点、训练方式、模型优缺点以及以及模型的分析方法。

本次学术沙龙使师生深度了解了视觉模型的应用与挑战，探索了视频任务建模与数据收集、图像替换与物体生成的相关技术，同时也激发了大家在计算机视觉方面的思考，为相关领域的研究和实践提供了参考和启示。