[논문리뷰] ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models

2025. 10. 21. 19:33·논문리뷰/기타

ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models

Jinheon Baek, Sujay Kumar Jauhar, Silviu Cucerzan, Sung Ju Hwang KAIST, Microsoft Research, DeepAuto.ai

 

 

목적

Research Agent & Reviewing Agent를 활용한 연구 도우미

기본적인 프로세스는 그림(B)에서 처럼 [문제 식별] → [방법론 개발] → [실험 디자인]으로 진행됩니다.

  1. Research Agent가 문제 식별 ⇒ 15명의 Reviewing Agents가 Feedback (코멘트 및 점수)
  2. Research Agent가 방법 개발 ⇒ 15명의 Reviewing Agents가 Feedback (코멘트 및 점수)
  3. Research Agent가 실험 설계 ⇒ 15명의 Reviewing Agents가 Feedback (코멘트 및 점수)

각각의 Agent는 참고할만한 데이터(논문데이터)가 인풋으로 함께 주어집니다.

 

 

데이터

Semantic Scholar API를 활용해 논문을 수집하고, 참조문헌을 활용해 연관논문도 함께 수집합니다. [논문을 어떻게 수집했고 필터링 했는지에 대한 방법에 대해서 언급되어 있습니다. (인용수, 그래프 활용) 해당 부분은 생략하겠습니다.] 모델의 Max Context Window 크기를 고려하여 [단일논문 + 연관논문의 엔티티(키워드)]가 입력으로 함께 주어집니다.

 

 

사례

  1. Research Agent에게 논문 1개와 관련논문 키워드를 제공하고. 문제 식별을 요구합니다.
  2. Reviewing Agent는 아래와 같이 피드백을 줍니다.
After your evaluation of the above content, please provide your review, feedback, and rating, in the format of Review: Feedback: Rating (1-5):

 

 

평가

ResearchAgent & ReviewingAgent 프로세스로 만든 실험 디자인 vs 단일 모델 프로세스로 만든 실험 디자인

5점 리커트 척도로 Clarity Relevance Originality Feasibility Significance 각각에 대해 평가합니다.

  1. LLM을 활용한 평가
  2. 논문을 3개 이상 Publish한 10명의 전문가가 평가

 

 

활용된 모델과 평가결과

GPT-4.0 | GPT-3.5 | Llama3 (8B) | Mixtral (8x7B) | Qwen1.5 (32B)가 활용되었습니다.

[모델을 활용한 평가 결과]

단일 모델보다 ResearchAgent가 좋다는 뜻.

Feedback을 반복할수록 성능이 좋아지긴 하지만. 너무 많이 하면 감소함.



'논문리뷰 > 기타' 카테고리의 다른 글

[논문리뷰] CoQuest: Exploring Research Question Co-Creation with an LLM-based Agent  (0) 2025.10.22
'논문리뷰/기타' 카테고리의 다른 글
  • [논문리뷰] CoQuest: Exploring Research Question Co-Creation with an LLM-based Agent
Yun Lab.
Yun Lab.
Yun Lab.
  • Yun Lab.
    윤랩
    Yun Lab.
  • 글쓰기 방명록 관리자
  • 전체
    오늘
    어제
    • 분류 전체보기 (26)
      • CS (13)
        • 컴퓨터구조 (6)
        • 운영체제 (7)
        • 네트워크 (0)
        • 시스템 프로그래밍 (0)
        • 데이터베이스 (0)
      • Git (0)
      • AI Study (6)
        • LLM (0)
        • Machine Learning (6)
      • 자격증 (2)
        • AICE (1)
        • 리눅스마스터 (1)
      • 논문리뷰 (4)
        • NeurIPS (0)
        • ICLR (1)
        • ICML (1)
        • 기타 (2)
      • 코딩테스트 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    도커
    프로세스와 스레드
    디시전트리
    ICML
    SVM
    머신러닝
    운영체제
    쿠버네티스
    2025ICML
    의사결정나무
    ML
    Machine Learning
    서포트벡터머신
    교착상태
    multi-agent
    명렁어
    ICLR2025
    LLM
    K-최근접이웃
    리눅스마스터
  • 최근 댓글

  • hELLO· Designed By정상우.v4.10.5
Yun Lab.
[논문리뷰] ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models
상단으로

티스토리툴바