Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении. В докладе Никита рассказал, чем его группа занимается прямо сейчас в направлении механистик интерпретабилити.
#nlp #ml #тбанк
405 views
329
85
7 months ago 00:22:43 0
How might LLMs store facts | Chapter 7, Deep Learning
11 months ago 00:17:35 0
What Do Neural Networks Really Learn? Exploring the Brain of an AI Model
1 year ago 00:16:46 3
What Time Dilation ACTUALLY Is In Relativity (Hint: It has nothing to do with time)
2 years ago 00:08:11 0
remains of once poetry - for cello, accordion, tape and live electronics (2023)
2 years ago 00:55:27 0
Open Problems in Mechanistic Interpretability: A Whirlwind Tour