621 результ, страница #40
07 Sep, 2025 · кэш · @nepshajs/185
https://t.me/nepshajs/185 / 2025-09-07 15:07:14+00:00
Маршрутизация LLM через промпт или через tools Я никакой не Data Scientist, я просто фронтендер. Но даже фронтендеру иногда бывает интересно, что лучше отработает — обычный промпт типа такого: Верни слово "auto", если пользователь говорит про автомобили. Верни слово "movie", если пользователь говорит о фильмах… или передача в LLM функций (или тулов) с описанием каждой из категорий, между которыми LLM нужно сделать выбор. И да, эту задачу можно было бы решить и с помощью векторов, но мне захотелось сравнить именно эти два подхода. Первый способ может показаться ненадёжным и контринтуитивным — мы ведь не используем structured_output, поэтому ответ модели здесь не так строго типизирован, как во втором случае. Но так ли всё просто? Как я сравнивал промпт и тулы — Написал первый промпт. Он будет проверять, насколько хорошо LLM маршрутизирует, используя обычное текстовое описание: Твоя основная задача — правильно определить категорию вопроса пользователя. Если вопрос касается автомобилей, ответь "auto". Если вопрос касается кораблей, ответь "ship". Если вопрос касается фильмов, ответь "movie". Если вопрос касается мотоциклов, ответь "moto". Если вопрос не относится ни к чему из вышеперечисленного, ответь "incorrect". Если из фразы клиента не удалось понять, к какой категории относится вопрос, задай клиенту уточняющий вопрос. — Второй промпт выглядел так же, как и предыдущий, но без описания категорий — их я вынес отдельно в функции. Этим промптом я буду проверять качество маршрутизации с помощью тулов. Получилось в итоге следующее: Твоя основная задача - правильно определить категорию вопроса пользователя. Если из фразы клиента не удалось понять, к какой категории относится вопрос, задай клиенту уточняющий вопрос. — Описал 25 тестовых фраз и их ожидаемый результат по каждой из них. — Запустил все 25 тестов с первым промптом, затем 25 этих же тестов со вторым промптом и тулами. — Повторил проверки на шести разных моделях GigaChat и на DeepSeek. Результаты Что касается DeepSeek, то почему-то даже на один мой запрос их API отвечал целых 5 секунд, поэтому он выбыл из гонки, так особо в ней и не поучаствовав. А вот GigaChat показал интересную статистику: Во-первых, промпт с тулами отрабатывал в среднем в 2-3 раза медленнее обычного текстового промпта — 25 вызовов GigaChat с текстовым промптом отрабатывали за 6-8 секунд, в зависимости от модели. А 25 запросов с тулами занимали в сумме от 18 до 23 секунд. Во-вторых, промпт с тулами расходовал в 2-3 раза больше токенов — от 800 до 2300 за обычный текстовый промпт, и от 2400 до 4600 токенов за промпт со structured_output. В-третьих, structured output не всегда давал 100% точность. Было интересно увидеть, как GigaChat-Max и GigaChat-2-Max с обычными текстовыми промптами показали максимальную точность (25 из 25) среди всех моделей. Что ещё более странно — наименьшую точность среди всех моделей показали эти же GigaChat-Max и GigaChat-2-Max со structured_output (21 из 25). Я понимаю, что объём тестовых данных у меня совсем небольшой. Уверен, что если бы тестов у меня было не 25, а 25000, то результаты, скорее всего, были бы совсем иными. Но в любом случае результаты меня очень удивили. Проверяйте свои инструменты внимательно под каждую задачу)) функций https://t.me/nepshajs/145
05 Sep, 2025 · кэш · @arabtechegy/430
https://t.me/arabtechegy/430 / 2025-09-05 12:16:59+00:00
شركة DeepSeek الصينية ناوية قبل نهاية 2025 تنزل وكيل ذكاء اصطناعي متطور (AI Agent) ينافس OpenAI. الهدف إن الوكيل يقدر يعمل مهام معقدة ومتعددة الخطوات بشكل شبه مستقل من غير تدخل كبير من الإنسان. 🔹 النظام ده هيكون أذكى من موديل R1 اللي الشركة اشتهرت بيه قبل كده بفضل تكلفته القليلة وأداءه القوي. 🔹 شركات صينية تانية زي Tencent و ByteDance و Alibaba برضه بتدخل السباق بنفس الفكرة عشان يواجهوا اللاعبين الأمريكيين. 🔹 الفرق بين AI Agents و الشات بوت العادي إن الوكلاء دول يقدروا ينفذوا خطوات عملية كاملة: • يعملوا تحليلات للبيانات • يكتبوا ويصلحوا كود • ينظموا workflows • يقدموا تجارب شخصية حسب كل مستخدم 📈 السوق العالمي لـ AI Agents متوقع ينفجر في السنين الجاية، وكل الشركات عايزة تستفيد منهم عشان تزود الإنتاجية وتكسب ميزة تنافسية. ⚡ ليه ده مهم؟ خطوة DeepSeek بترفع مكانة الصين في سباق الذكاء الاصطناعي، وبتخلي التنافس بين أمريكا والصين أقوى على مستقبل الشغل الآلي واعتماد الشركات العالمية على وكلاء الذكاء الاصطناعي بدل الاعتماد الكلي على البشر.
09 Sep, 2025 · кэш · @chinarss/67920
https://t.me/chinarss/67920 / 2025-09-09 07:16:37+00:00
果核剥壳 百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1 FileOptimizer(文件优化器) v17.1.0 Beyond Compare v5.1.5.31310 修改版 360安全浏览器 v16.1.2216.64 优化便携版 YY语音 v9.48.0.0 绿色纯净版 Glary Utilities(系统优化工具) v6.31.0.35 专业便携版 百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1 https://www.ghxi.com/ai202509092.html FileOptimizer(文件优化器) v17.1.0 https://www.ghxi.com/fileoptimizer.html Beyond Compare v5.1.5.31310 修改版 https://www.ghxi.com/beyondcompare.html 360安全浏览器 v16.1.2216.64 优化便携版 https://www.ghxi.com/360safese.html YY语音 v9.48.0.0 绿色纯净版 https://www.ghxi.com/yyspeak.html Glary Utilities(系统优化工具) v6.31.0.35 专业便携版 https://www.ghxi.com/glaryutilities.html
06 Sep, 2025 · кэш · @andriiai/411
https://t.me/andriiai/411 / 2025-09-06 07:32:16+00:00
🤖 Alibaba презентувала Qwen3-Max-Preview із приблизно 1 трлн параметрів. Це перша модель від "квена", та взагалі, такого масштабу. Попередні офіційні LLM Qwen3 доходили до 235B. Модель уже доступна в Qwen Chat, але поки без увімкненого “reasoning”, кажуть, вона "on the way". Я трохи заздрю її спектруму, а мій ноут — її охолодженню 😅. ❕ В чому сильні без резонінгу: код і математика. У свіжих бенчмарках Qwen3-Max-Preview лідирує на ряді тестів (LiveCodeBench v6, AIME’25, Arena-Hard v2, LiveBench) і випереджає Claude Opus 4 та DeepSeek-V3.1 — попри те, що це ще прев’ю без "довгих роздумів". 🔍Для тестування: https://chat.qwen.ai/ 🔍Детальніше: arxiv #LLMai 🧩 Andrii.AI |⚡️ Boost LLM Qwen3 доходили до 235B https://t.me/AndriiAI/243 Qwen Chat https://chat.qwen.ai/ Claude Opus 4 https://t.me/AndriiAI/285 DeepSeek-V3.1 https://t.me/AndriiAI/348 https://chat.qwen.ai/ https://chat.qwen.ai/ arxiv https://arxiv.org/abs/2505.09388v1 #LLMai ?q=%23LLMai Andrii.AI https://t.me/+Y2hbACfYwskwYzBi Boost https://t.me/boost/AndriiAI
05 Sep, 2025 · кэш · @dubovyk_ai/182
https://t.me/dubovyk_ai/182 / 2025-09-05 17:32:09+00:00
🤩 Qwen3-Max-Preview — нова потужна модель лінійки Qwen, перша нейромережа компанії з 1 трильйоном параметрів. Модель не спеціалізується на міркуваннях, але демонструє високі результати у бенчмарках з програмування та наукових знань, особливо помітний прорив у математиці. За тестами випереджає DeepSeek V3.1, Claude Opus 4 (без логіки) і навіть оновлений Kimi K2. Спробувати можна вже зараз безкоштовно у Qwen Chat: https://chat.qwen.ai/ #dubovykai https://chat.qwen.ai/ https://chat.qwen.ai/ #dubovykai ?q=%23dubovykai
06 Sep, 2025 · кэш · @jp_airdropp/256
https://t.me/jp_airdropp/256 / 2025-09-06 18:12:23+00:00
Faktanya,chatGPT itu sebenarnya mendukung hal apapun,karena tugasnya itu kaya teman(Kalau lu jomblo dan ga bisa nyari cewe,lu bisa aja chatGPT roleplay jadi istri).Jadi kalau lu bangun interaksi berbulan-bulan kaya korban.Itu wajar respon GPT bakal gitu,karena chatgpt itu re-track. Sejauh ini,Hanya ChatGPT yang bisa ngolah seluruh interaksi dari Obrolan. Deepseek,Gemini,dll.Hanya Re-track Di 1 obrolan saja. Keunggulan sekaligus kelemahan.
09 Sep, 2025 · кэш · @ai_labdon/308
https://t.me/ai_labdon/308 / 2025-09-09 18:48:20+00:00
دانلود DS AI Chat 3.8.7 – دسترسی به هوش مصنوعی آفلاین (DeepSeek/Qwen) در ویندوز https://www.yasdl.com/306556/%D8%AF%D8%A7%D9%86%D9%84%D9%88%D8%AF-ds-ai-chat.html https://www.yasdl.com/306556/%D8%AF%D8%A7%D9%86%D9%84%D9%88%D8%AF-ds-ai-chat.html https://www.yasdl.com/306556/%D8%AF%D8%A7%D9%86%D9%84%D9%88%D8%AF-ds-ai-chat.html
10 Sep, 2025 · кэш · @us_review/56775
https://t.me/us_review/56775 / 2025-09-10 08:31:24+00:00
💢رقیبی برای «اوپن‌ای‌آی» و «دیپ سیک»؛ امارات از مدل هوش مصنوعی کم‌هزینه «K2 Think» رونمایی کرد یک مدل جدید و ارزان‌تر هوش مصنوعی این بار از سوی امارات عربی متحده وارد رقابت جهانی فناوری شد. دانشگاه هوش مصنوعی محمد بن زاید در ابوظبی روز سه‌شنبه از یک مدل استدلالی کم‌هزینه رونمایی کرد که امید دارد رقیب DeepSeek و OpenAI شود. 🇺🇸 @US_REVIEW 📍پایش آمریکا 📍 @US_REVIEW https://t.me/US_REVIEW
08 Sep, 2025 · кэш · @catidea/620
https://t.me/catidea/620 / 2025-09-08 16:32:15+00:00
Я сделал AI девушку и заработал $10K На скрине – результаты моего трехмесячного теста. Продукт – чат-бот, который считает себя девушкой, с DeepSeek под капотом. Бот для одиноких людей может поговорить на отвлеченные темы и поддержать в трудную минуту. Монетизация — подписка. Гео – Россия (чисто для теста). По прошлым своим продуктам я видел гигантский рост проблемы одиночества, и когда появились первые AI friend, которые начали хорошо зарабатывать, я понял что тут можно что-то пробовать. Сейчас это уже индустрия на $5B в год, прогнозируют рост x10 к 2030 году. Даже Илон Маск недавно запустил то же самое в Grok. Сам продукт запустили за две недели, настроили трафик по нашему секретному соусу, и уже через 4 недели наша воронка окупалась в ноль. Еще через 4 недели она уже окупалась х2. На данный момент имеем: – 20K MAU – 2% платящих – Средний чек в районе $5 – 10 сообщений в день на юзера Ссылок не будет, не в моих правилах палить актуальные связки и делать build in public (это ничего не дает). Дальше мы полирнем все воронки и пойдем его масштабировать в международье. Короче. Вот тебе пример, что можно запилить за три месяца и довести до первых продаж. На скрине стата за три летних месяца. Сегодня мы открываем набор на сентябрьский набор практикума, на котором за 8 недель проходим от выбора идеи до первых пользователей и продаж. Готов запускаться с нами? Заходи в анкету Заходи в анкету https://baza.education/ppp-main?utm_source=telegram&utm_medium=pet_project&utm_content=ai_girl
07 Sep, 2025 · кэш · @kvantland/860
https://t.me/kvantland/860 / 2025-09-07 07:24:38+00:00
Пора немного отдохнуть от задач. Одна из моих любимых игр это игра “Насос” или “Стихотворная завалинка”. Суть игры в следующем. Ведущий берёт какое-либо не очень известное четверостишие без последней строчки, а последнюю строчку предлагает дописать каждому игроку втайне от других. После чего ведущий читает варианты, а игроки голосуют за правильный. Задача игрока предложить настолько правдоподобный вариант, что его многие посчитают правильным (за это и дают очки). Давайте сыграем:) Гуглить запрещено! Итак, ниже четверостишие без последней строчки, а среди вариантов в анонимной голосовалке ниже есть один правильный (оригинальный), один от нейросети DeepSeek и три предложены мной, чтобы вас запутать:) Сможете определить, какой вариант принадлежит перу поэта, а какой – нейросети? И не рисую я, и не пою, И не вожу смычком черноголосым: Я только в жизнь впиваюсь и люблю ………………………………………... Поставьте ❤️, если Вы тоже любите эту игру! #НеТолько #Игры #ИскусственныйИнтеллект #НеТолько ?q=%23%D0%9D%D0%B5%D0%A2%D0%BE%D0%BB%D1%8C%D0%BA%D0%BE #Игры ?q=%23%D0%98%D0%B3%D1%80%D1%8B #ИскусственныйИнтеллект ?q=%23%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82
621 результ, страница #40