Гурт який я почав слухати в школі, нарешті мав змогу почути в лайві. За цей час соліст встиг піти з групи, повернутися і тепер у гурта 2 соліста, що трохи незвично 🫣
#threedaysgrace
Posts by Konark 🐍
по таким в школі лазили
Відпочити пару днів від шумного міста в селі де навіть немає магазину, це такий кайф. Озеро, ліс, пташки, гриль, і нікого навкруги.
В них спочатку місяць, потім день, ні?
Хотів би поділитися своїм досвідом лікування зубів в Албанії і цінами.
Отже, летів в низький сезон, тому в цілому все дешево.
Коротко по цінам:
20-50 євро пломба, залежить від складності
200 євро з роботою коронка з цирконію
Детальніше в посиланні нижче ⬇️
Пішоходів поки не зрозуміло чи треба пропускати, хоча вони наче не особливо питають, переходять де зручно. Але звикаєш, і просто насолоджуєшся красою країни 🇦🇱
Водіння авто в Албанії це цікавий досвід. Тут свої правила, забудьте все що ви знали з автошколи 😁
На кільці ви не завжди головні, від чого це залежить, поки не вияснив. Паркуватися можна всюди. На зупинці? Чому ні. Немає місця там, можна другим рядом. Якщо другий ряд зайнятий, можна і третім.
Неприємно
“Чи програють США війну в галузі штучного інтелекту?” Я так не думаю. DeepSeek зробили кілька великих проривів, а ми — сотні невеликих. Якщо ми приймемо архітектуру DeepSeek, наші моделі стануть кращими. Тому що в нас більше обчислювальних потужностей і даних.
Крім того, експортні обмеження не нашкодили їм настільки, як ми очікували. Ймовірно, тому, що наші експортні обмеження були, відверто кажучи, доволі паршивими. H800 гірші за H100 лише з точки зору пропускної здатності між чипами.
Є ще низка дрібних інновацій, але ці є найважливішими.
Я не думаю, що тут є щось магічне. Справді, вони просто зробили дві величезні інновації для зниження витрат, що дозволило їм проводити більше експериментів і швидше зворотно розробити o1.
Як вони повторили o1?
Використовуючи навчання з підкріпленням. Вони брали складні запитання, які легко перевірити (наприклад, математичні задачі або код), і оновлювали модель, якщо відповідь була правильною.
Чому інференс у DeepSeek обходиться настільки дешевше?
Вони стиснули KV-кеш. (Це був прорив, якого вони досягли деякий час тому.)
Як DeepSeek тренувався настільки ефективніше?
Вони використовували формули (наведені нижче), щоб «передбачити», які токени модель активує. Потім вони тренували лише ці токени. Вони потребували на 95% менше GPU, ніж Meta, бо для кожного токена вони тренували лише 5% параметрів.
Як DeepSeek обійшов експортні обмеження?
Ніяк. Вони просто експериментували з чипами, щоб максимально ефективно використовувати пам’ять. Їм пощастило, і їхній ідеально оптимізований низькорівневий код не обмежувався пропускною здатністю чипів.
ЯК DEEPSEEK ЗМІГ ТАК ДЕШЕВО?
Юзер X wordgrammer розібрався як саме DeepSeek навчався за 1/30 вартості.
Переклад.
#штучнийінтелект
З Лондону?
Нетфлікс одразу наче випускає всі ))
Так і не скажеш
Я теж думав, а потім такий... Я ж всеодно окрім масажу серця і дефібрілятора нічого не вмію
Також використовую search.brave.com щоб визирнути з бульбашки. Але локально краще google досі нічого немає 🤷
В твіттері виявляється є люди які не знають навіщо ChatGPT. Але ладно. Не всі знають про такий проект як Perplexity
Це суміш гугла і чатгпт, безкоштовно :)
👉 perplexity.ai
По факту він шукає в інтернеті, дає відповідь з посиланнями.
Тепер використовую його якщо треба щось дізнатися.
Трохи halloween 🕸️🕷️
Цікавий досвід прогулянки по кладовищу. Одному. Можна багато про що подумати. Такий собі акт терапії.
Міні серіали це найкращий формат кіно. Вже дивлюсь 5й підряд, і це прямо добре.
Треба робити підбірку?)
Те що треба о 4й ранку🥲
Куди дивиться поліція?
Ну це я знаю, знайомий там шукав більше року, каже прямо кастинг де українець з незрозумілим статусом явно не в лідерах. Але ж в маленьких містах напевно з роботою гірше, і взагалі від скуки можна повіситися