앤트로픽, Claude Opus 4.8 공개… AI의 성능 경쟁에서 ‘업무 수행’ 경쟁으로
Claude Opus 4.8과 Dynamic Workflows는 AI의 경쟁 무대를 ‘더 똑똑한 답변’에서 ‘더 복잡한 업무 수행’으로 옮기고 있습니다.

최신 뉴스, 핵심 개념 위키, 바로 쓰는 프롬프트, 학습 강좌를 한곳에서 살펴보세요.
데이터와 인공지능 분야의 최근 소식을 모았습니다.
Claude Opus 4.8과 Dynamic Workflows는 AI의 경쟁 무대를 ‘더 똑똑한 답변’에서 ‘더 복잡한 업무 수행’으로 옮기고 있습니다.

구글, ‘Antigravity 2.0’ 공개
구글이 AI 에이전트 중심 개발 플랫폼 ‘Antigravity 2.0’을 공개했습니다

“실행 파일만 보고 프로그램 복원하라”… 메타가 공개한 AI 코딩 벤치마크 ‘ProgramBench’
메타는 AI가 단순 코드 생성 수준을 넘어 실제 소프트웨어를 얼마나 이해하고 재구성할 수 있는지를 평가하는 새로운 벤치마크 ProgramBench를 공개했다.

METR “클로드 미토스, 인간 기준 16시간짜리 업무 수행 가능”…기존 AI 평가 체계 한계 도달
Anthropic의 차세대 모델 ‘Claude Mythos Preview’가 현행 benchmark로 측정 가능한 상한선에 근접

이제 AI가 스스로 목표를 끝까지 수행한다
Codex에 ‘/goal’ 기능 추가… 자동 반복 실행 시대 열려
GPT에서 고블린이 왜 나와?
강화학습 보상이 특정 단어 사용을 유도하고, 그 결과가 전체 GPT 언어 행동으로 퍼진 사례
바로 활용할 수 있는 프롬프트 템플릿입니다.
데이터 분석, 인공지능, 프로그래밍을 주제별로 학습하세요.