Rico's Nerd Cluster

Home
About
Archive

Machine-Learning

ViT

Posted by Rico's Nerd Cluster on March 8, 2026

ViT in short:

Image -> 16x16 patches [16 x 16 x 3] -> project to [256/768] token embedding TODO

Previous
Model Parameter vs VRAM
Next
DETR

CATALOG

FEATURED TAGS

Math Deep Learning Robotics C++ Linux Machine-Learning ROS2 Python SLAM Computer Vision Docker ROS CUDA RGBD Slam Electronics Hands-on Career Advice robotics Build Systems CMake Control Systems Hands-On ML Oil and Gas ROS1 Web Devel

FRIENDS

Cheng Wei
Jerry Zhao
Sebastian Castro
Jon Meyer
Sik-Ho Tsang
技术刘
Brandon Rohrer
箐茗
Solomon Amos
DaNing
Rodney Brooks
周明倫

Copyright © Rico's Nerd Cluster 2026
Powered by Rico's Blog |