Hugging Face
자신감 있는 스플래팅: 학습 가능한 베타 분포를 통한 3D 가우시안 스플래팅의 자신감 기반 압축
1일 전
Hugging Face
엘라: 평생 기억을 가진 구현된 사회적 에이전트
1일 전
Hugging Face
Peccavi: 시각적 패러프레이즈 공격 안전하고 왜곡 없는 AI 생성 이미지 워터마킹 기법
1일 전
Hugging Face
MusiXQA: 멀티모달 대형 언어 모델에서의 시각적 음악 이해 발전
1일 전
Hugging Face
IR3D-Bench: 비전-언어 모델 장면 이해 평가를 위한 에이전트적 역 렌더링
1일 전
Hugging Face
언어 모델 훈련을 위한 데이터 효율성
1일 전
Hugging Face
DiffuCoder: 코드 생성을 위한 마스크 확산 모델 이해 및 개선
1일 전
Hugging Face
MoCa: 모달리티 인식 지속적 사전 학습을 통한 양방향 멀티모달 임베딩 개선
1일 전
Hugging Face
Tower+: 다국어 LLM에서 일반성과 번역 전문성의 연결
2일 전
Hugging Face
열화 모델링 다중 경로 확산을 통한 조정 가능한 메탈렌즈 사진 촬영
2일 전
Hugging Face
VOCABTRIM: 대규모 언어 모델에서 효율적인 추측 디코딩을 위한 어휘 가지치기
2일 전
Hugging Face
ThinkSound: 멀티모달 대형 언어 모델에서의 연쇄적 사고 추론을 통한 오디오 생성 및 편집
2일 전
Hugging Face
도구의 언어를 말하도록 언어 모델을 가르치기
2일 전
Hugging Face
MARBLE: 다중 모달 공간 추론 및 계획을 위한 어려운 벤치마크
2일 전
Hugging Face
UrbanLLaVA: 도시 지능을 위한 공간 추론 및 이해를 갖춘 다중 모달 대형 언어 모델
2일 전
Hugging Face
RExBench: 코딩 에이전트가 AI 연구 확장을 자율적으로 구현할 수 있을까?
2일 전
Hugging Face
Aha 모멘트 재조명: VLM은 추론 시간 스케일링에서 진정한 자기 검증이 가능한가?
2일 전
Hugging Face
SparseLoRA: 문맥적 희소성을 활용한 대형 언어 모델 미세 조정 가속화
2일 전
Hugging Face
일관된 비행시간 심도 노이즈 제거: 그래프 정보 기반 기하학적 주의
2일 전
Hugging Face
MEMFOF: 메모리 효율적인 다중 프레임 광류 추정을 위한 고해상도 학습
2일 전
Hugging Face
맥락 내에서 진화하는 프롬프트: 개방형, 자기 복제적 관점
2일 전
Hugging Face
청취자 보상 사고를 통한 이미지 선호도 학습
2일 전
Hugging Face
캘리그래퍼: 자유 스타일 텍스트 이미지 커스터마이제이션
2일 전
Hugging Face
VMoBA: 비디오 확산 모델을 위한 블록 혼합 주의 메커니즘
2일 전
Hugging Face
SPIRAL: 제로섬 게임에서의 자기 플레이가 다중 에이전트 다중 턴 강화 학습을 통해 추론을 장려하다
2일 전
Hugging Face
GPAS: LLM 사전 학습 수렴 가속화를 위한 그래디언트 보존 활성화 스케일링
3일 전
Hugging Face
잠재 조정 벡터를 통한 분수 추론이 추론 시간 계산을 개선하다
3일 전
Hugging Face
적응형 도메인 모델링과 언어 모델: 다중 에이전트 접근법을 통한 작업 계획
3일 전
Hugging Face
자연 세계 이미지에 대한 글로벌 및 로컬 함의 학습
3일 전
Hugging Face
RetFiner: 망막 기초 모델을 위한 비전-언어 정제 스킴
3일 전
Hugging Face
대규모 시스템 성능 예측을 위한 텍스트-텍스트 회귀
3일 전
Hugging Face
제한된 시각에서의 공간적 정신 모델링
3일 전
Hugging Face
Confucius3-Math: 중국 K-12 수학 학습을 위한 경량 고성능 추론 LLM
3일 전
Hugging Face
노이즈 일관성 훈련: 추가 제어 학습을 위한 원스텝 생성기의 본질적 접근법
3일 전
Hugging Face
Gazal-R1: 매개변수 효율적인 2단계 훈련을 통한 최첨단 의료 추론 달성
3일 전
Hugging Face
SMMILE: 전문가 주도의 멀티모달 의료 인컨텍스트 학습 벤치마크
3일 전
Hugging Face
비전-언어 모델은 내부 세계 모델을 가지고 있는가? 원자적 평가를 향하여
3일 전
Hugging Face
자동화된 LLM 스피드런 벤치마크: NanoGPT 개선 재현
3일 전
Hugging Face
세밀한 선호 최적화가 VLM의 공간 추론을 개선하다
3일 전
Hugging Face
모션을 위한 형태: 3D 프록시를 활용한 정밀하고 일관된 비디오 편집
3일 전
Hugging Face
MiCo: 다중 이미지 대비를 통한 강화 시각 추론
3일 전
Hugging Face
Pangu Pro MoE: 그룹화된 전문가 혼합을 통한 효율적인 희소성
3일 전
Hugging Face
Ark: 오픈 소스 Python 기반 로봇 학습 프레임워크
3일 전
Hugging Face
이상에서 현실로: 현실 세계 시나리오를 위한 통합적이고 데이터 효율적인 밀집 예측
3일 전
Hugging Face
ShotBench: 비전-언어 모델에서의 전문가 수준의 영화적 이해
3일 전
Hugging Face
XVerse: DiT 변조를 통한 정체성과 의미 속성의 일관된 다중 주제 제어
3일 전
Hugging Face
LLaVA-Scissor: 비디오 LLM을 위한 의미적 연결 요소를 활용한 토큰 압축
3일 전
Hugging Face
BlenderFusion: 3D 기반 시각적 편집 및 생성적 합성
3일 전