多模态算法研发: 设计和开发业界领先的多模态融合算法,处理并融合2D(RGB/多光谱)、3D(结构光/线激光/点云)数据,提升复杂材质和三维结构下的缺陷检测与测量精度。
视觉-语言模型(VLM)落地: 将文本模态引入AOI流程,研发基于Prompt的零样本/小样本(Zero-shot/Few-shot)异常检测模型,实现通过自然语言指令进行柔性检测,以及缺陷的自动化文本归因与报告生成。
前沿技术追踪与创新: 持续追踪计算机视觉、多模态大模型、生成式AI等领域的SOTA进展,主导核心技术攻关,并在顶级会议(CVPR/ICCV/ECCV等)发表论文或申请核心专利。
系统级部署与优化: 参与端到端(E2E)视觉检测系统的架构设计,协同硬件与软件团队,确保复杂深度学习模型在边缘端或工业云平台的高效推理与闭环迭代。