12 5

guoguoc PRO

woshichaoren123

AI & ML interests

None yet

Recent Activity

updated a dataset about 5 hours ago

woshichaoren123/vis_data_0424_data

published a dataset about 6 hours ago

woshichaoren123/vis_data_0424_data

published a Space about 6 hours ago

woshichaoren123/vis_data_0424

View all activity

Organizations

None yet

updated a dataset about 5 hours ago

woshichaoren123/vis_data_0424_data

Updated about 4 hours ago

published a dataset about 6 hours ago

woshichaoren123/vis_data_0424_data

Updated about 4 hours ago

published a Space about 6 hours ago

Vis Data 0424

🏆

Generate a personalized greeting from a name

updated a model about 8 hours ago

woshichaoren123/Eagle_Embody_4B_General

4B • Updated about 8 hours ago

published a model about 8 hours ago

woshichaoren123/Eagle_Embody_4B_General

4B • Updated about 8 hours ago

upvoted a paper about 14 hours ago

Seeing Fast and Slow: Learning the Flow of Time in Videos

Paper • 2604.21931 • Published 1 day ago • 13

updated a dataset 4 days ago

woshichaoren123/egoplan_video

Updated 4 days ago • 54

published a dataset 4 days ago

woshichaoren123/egoplan_video

Updated 4 days ago • 54

upvoted a paper 7 days ago

HiVLA: A Visual-Grounded-Centric Hierarchical Embodied Manipulation System

Paper • 2604.14125 • Published 10 days ago • 20

upvoted a paper 14 days ago

HY-Embodied-0.5: Embodied Foundation Models for Real-World Agents

Paper • 2604.07430 • Published 17 days ago • 185

updated a dataset 17 days ago

woshichaoren123/text

Viewer • Updated 17 days ago • 2.69M • 45

published a dataset 19 days ago

woshichaoren123/text

Viewer • Updated 17 days ago • 2.69M • 45

updated a Space 23 days ago

Test

💬

Locate objects in images and videos

upvoted 3 papers about 1 month ago

WorldAgents: Can Foundation Image Models be Agents for 3D World Models?

Paper • 2603.19708 • Published Mar 20 • 13

3DreamBooth: High-Fidelity 3D Subject-Driven Video Generation Model

Paper • 2603.18524 • Published Mar 19 • 58

Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action Models

Paper • 2603.15618 • Published Mar 16 • 21

published a Space about 1 month ago

Test

💬

Locate objects in images and videos

upvoted a paper about 1 month ago

VideoAgentTrek: Computer Use Pretraining from Unlabeled Videos

Paper • 2510.19488 • Published Oct 22, 2025 • 21

upvoted a paper about 2 months ago

RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies

Paper • 2603.04639 • Published Mar 4 • 29

guoguoc PRO

AI & ML interests

Recent Activity

Organizations

woshichaoren123's activity

Vis Data 0424

Test

Test