Trending

Content tagged with "transformers"

Show all

Hacker News

Top stories from the Hacker News community• Updated 10 minutes ago

HN

Is Gemini 2.5 good at bounding boxes?

simedw.com

235

simedw

about 9 hours ago

ai object-detection transformers computer-vision nlp

HN

QRS: Epsilon Wrangling

tbray.org

13

zdw

1 day ago

ai data-science transformers nlp

HN

Perplexity Comet

comet.perplexity.ai

30

birriel

1 day ago

llm transformers generative-ai

HN

Smollm3: Smol, multilingual, long-context reasoner LLM

huggingface.co

356

kashifr

2 days ago

llm transformers nlp

HN

The Tradeoffs of SSMs and Transformers

goombalab.github.io

54

jxmorris12

2 days ago

ai transformers nlp

HN

OLMo 2 - a family of fully-open language models

allenai.org

25

oldfuture

2 days ago

ai llm transformers generative-ai

HN

LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping

studios.disneyresearch.com

124

jw1224

3 days ago

neural-networks ai vision transformers computer-vision diffusion-models deep-learning generative-ai

HN

Optimizing Tool Selection for LLM Workflows with Differentiable Programming

viksit.substack.com

113

viksit

5 days ago

ai diffentiable-programming llm transformers model-serving deep-learning differentiable-programming

HN

The Right Way to Embed an LLM in a Group Chat

blog.tripjam.app

15

kenforthewin

5 days ago

rag llm transformers

Reddit

Top posts from tech subreddits• Updated 40 minutes ago

Reddit

[R] The Bitter Lesson is coming for Tokenization

reddit.com

174

lucalp__

9 days ago

r/MachineLearning ai transformers nlp

Reddit

Huawei releases an open weight model Pangu Pro 72B A16B. Weights are on HF. It should be competitive with Qwen3 32B and it was trained entirely on Huawei Ascend NPUs. (2505.21411)

huggingface.co

422

FullOf_Bad_Ideas

9 days ago

r/LocalLLaMA ai llm transformers ai-research

Reddit

Gemma 3n Fine-tuning now in Unsloth - 1.5x faster with 50% less VRAM + Fixes

reddit.com

218

danielhanchen

9 days ago

r/LocalLLaMA ai transformers model-serving deep-learning mlops

Reddit

Training and Finetuning Sparse Embedding Models with Sentence Transformers v5

huggingface.co

12

-Cubie-

9 days ago

r/LocalLLaMA sentence-transformers transformers nlp embeddings

Reddit

KrunchWrapper - a LLM compression proxy (beta)

i.redd.it

49

LA_rent_Aficionado

10 days ago

r/LocalLLaMA ai llm transformers model-serving

Reddit

[R] Inference-Time Scaling and Collective Intelligence for Frontier AI

reddit.com

17

iwiwijp

10 days ago

r/MachineLearning ai llm transformers

Reddit

[D] How far are we from LLM pattern recognition being as good as designed ML models

reddit.com

11

chrisfathead1

10 days ago

r/MachineLearning ai llm transformers deep-learning mlops

Reddit

[R] BIG-Bench Extra Hard

arxiv.org

6

EducationalCicada

10 days ago

r/MachineLearning ai llm transformers

Reddit

[P] I've built a spec for LLM-to-LLM comms by combining semantic patterns with structured syntax

reddit.com

2

sbuswell

10 days ago

r/MachineLearning llm transformers nlp

Hugging Face Trending

Popular models from Hugging Face• Updated 22 minutes ago

GLM-4.1V-9B-Thinking

Task: image-text-to-text

523

20,361

llm transformers generative-ai

Hugging Face Smol Models Research

SmolLM3-3B

Task: text-generation

284

11,955

llm transformers generative-ai

gemma-3n-E4B-it

Task: image-text-to-text

536

251,044

ai nlp transformers

TNG Technology Consulting GmbH

DeepSeek-TNG-R1T2-Chimera

Task: text-generation

192

3,552

llm transformers generative-ai

K intelligence Mi:dm

Midm-2.0-Base-Instruct

Task: text-generation

92

10,099

llm transformers generative-ai

Hugging Face Smol Models Research

SmolLM3-3B-Base

Task: text-generation

88

1,893

llm transformers generative-ai

Hunyuan-A13B-Instruct

756

31,133

llm transformers ai

Devstral-Small-2507

Task: text-generation

63

115

llm transformers generative-ai

A.X-4.0

Task: text-generation

140

2,542

llm transformers generative-ai

GitHub Trending

Popular repositories from GitHub• Updated 36 minutes ago

llama_index

LlamaIndex is the leading framework for building LLM-powered agents over your data.

Python

42,996

6,185

llm python generative-ai data-engineering ai transformers rag vector-search nlp

Megatron-LM

Ongoing research training transformer models at scale

Python

12,825

2,917

transformers deep-learning python nlp llm

pytorch-image-models

The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more

Python

34,696

4,951

pytorch deep-learning computer-vision transformers model-serving

transformers

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python

146,761

29,601

transformers pytorch tensorflow deep-learning nlp python mlops ai

yolov7

Implementation of paper - YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

Jupyter Notebook

13,883

4,362

computer-vision deep-learning transformers yolov7 object-detection

Swin-Transformer

This is an official implementation for "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows".

Python

14,946

2,152

transformers computer-vision python deep-learning

Unstructured-IO

unstructured

Convert documents to structured data effortlessly. Unstructured is open-source ETL solution for transforming complex documents into clean, structured formats for language models. Visit our website to learn more about our enterprise grade Platform product for production grade workflows, partitioning, enrichments, chunking and embedding.

HTML

11,693

966

etl data-engineering embeddings transformers

optimum

🚀 Accelerate inference and training of 🤗 Transformers, Diffusers, TIMM and Sentence Transformers with easy to use hardware optimization tools

Python

2,889

534

transformers deep-learning python

vit-pytorch

Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch

Python

22,700

3,281

pytorch transformers computer-vision