ynnnxxi's 개 빡센 하루 시작 ❤︎

  • 홈
  • 태그
  • 방명록

MLLM 1

MEERKAT: Audio-Visual Large Language Model for Grounding in Space and Time

MEERKAT: Audio-Visual Large Language Model for Grounding in Space and Time (ECCV 2024) Chowdhury, Sanjoy, et al. "Meerkat: Audio-visual large language model for grounding in space and time." European Conference on Computer Vision. Cham: Springer Nature Switzerland, 2024. AbstractLLM(Large Language Model)의 뛰어난 능력을 활용해서 최근의 MLLM(Multimodal Large Language Model) 연구는 이를 visual, audio와 같은 다른 modalit..

Paper 2025.09.23
이전
1
다음
더보기
프로필사진

ynnnxxi's 개 빡센 하루 시작 ❤︎

공부 기록 Blog | 맨날 까먹는 거 공부합니다 ^..♡⃛

  • 분류 전체보기 (16)
    • Task (0)
    • Paper (9)
    • Code (2)
    • Research diary (1)
    • Concept (4)

Tag

vision transformer, Question Answering, AVQA, commensense, paper, Question-aware, VQA, CVPR, Multimodal, MovieChat, Video Question Answering, Tensor #Deeplearning #PyTorch #Tensorflow, VideoQuestionGrounding, VideoQA, TPAMI, VideoQG, llm, post-hoc, Long video, Review,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바