Browsing: Hugging Face

Hugging Face

UItron: Foundational GUI Agent with Advanced Perception and Planning – Takara TLDR

Advanced AI EditorSeptember 1, 2025

GUI agent aims to enable automated operations on Mobile/PC devices, which is an important task toward achieving artificial general intelligence.…

Hugging Face

TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training – Takara TLDR

Advanced AI EditorSeptember 1, 2025

The data mixture used in the pre-training of a language model is a cornerstone of its final performance. However, a…

Hugging Face

AHELM: A Holistic Evaluation of Audio-Language Models – Takara TLDR

Advanced AI EditorSeptember 1, 2025

Evaluations of audio-language models (ALMs) — multimodal models that take interleaved audio and text as input and output text –…

Hugging Face

Morae: Proactively Pausing UI Agents for User Choices – Takara TLDR

Advanced AI EditorSeptember 1, 2025

User interface (UI) agents promise to make inaccessible or complex UIs easier to access for blind and low-vision (BLV) users.…

Hugging Face

HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous Manipulation – Takara TLDR

Advanced AI EditorSeptember 1, 2025

Leveraging human motion data to impart robots with versatile manipulation skills has emerged as a promising paradigm in robotic manipulation.…

Hugging Face

Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models – Takara TLDR

Advanced AI EditorSeptember 1, 2025

Large language models (LLMs) excel at complex reasoning tasks such as mathematics and coding, yet they frequently struggle with simple…

Hugging Face

rStar2-Agent: Agentic Reasoning Technical Report – Takara TLDR

Advanced AI EditorAugust 30, 2025

We introduce rStar2-Agent, a 14B math reasoning model trained with agentic reinforcement learning to achieve frontier-level performance. Beyond current long…

Hugging Face

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning – Takara TLDR

Advanced AI EditorAugust 30, 2025

Recent advancements highlight the importance of GRPO-based reinforcement learning methods and benchmarking in enhancing text-to-image (T2I) generation. However, current methods…

Hugging Face

Turning the Spell Around: Lightweight Alignment Amplification via Rank-One Safety Injection – Takara TLDR

Advanced AI EditorAugust 30, 2025

Safety alignment in Large Language Models (LLMs) often involves mediating internal representations to refuse harmful requests. Recent research has demonstrated…

Hugging Face

OneReward: Unified Mask-Guided Image Generation via Multi-Task Human Preference Learning – Takara TLDR

Advanced AI EditorAugust 30, 2025

In this paper, we introduce OneReward, a unified reinforcement learning framework that enhances the model’s generative capabilities across multiple tasks…

What's Hot

C3.ai: Stay Patient Through The Transition (NYSE:AI)

Automated Structured Radiology Report Generation with Rich Clinical Context – Takara TLDR

The ghost in the machine

Browsing: Hugging Face

UItron: Foundational GUI Agent with Advanced Perception and Planning – Takara TLDR

TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training – Takara TLDR

AHELM: A Holistic Evaluation of Audio-Language Models – Takara TLDR

Morae: Proactively Pausing UI Agents for User Choices – Takara TLDR

HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous Manipulation – Takara TLDR

Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models – Takara TLDR

rStar2-Agent: Agentic Reasoning Technical Report – Takara TLDR

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning – Takara TLDR

Turning the Spell Around: Lightweight Alignment Amplification via Rank-One Safety Injection – Takara TLDR

OneReward: Unified Mask-Guided Image Generation via Multi-Task Human Preference Learning – Takara TLDR

Former ARTnews Publisher Dies at 97

National Gallery of Art Closes as a Result of Government Shutdown

Almine Rech Closes London Gallery After More Than a Decade

Record Exec and Art Collector Gets Over 4 Years

C3.ai: Stay Patient Through The Transition (NYSE:AI)

Automated Structured Radiology Report Generation with Rich Clinical Context – Takara TLDR

The ghost in the machine

What's Hot

Browsing: Hugging Face

Subscribe to Updates