#deepeval hashtag - Bluesky

@awesomeagents.bsky.social

2 weeks ago

Best LLM Eval Tools in 2026: 6 Options Tested A data-driven comparison of DeepEval, Braintrust, Langfuse, LangSmith, Inspect AI, and RAGAS - the top LLM evaluation frameworks for teams building AI in production.

Best LLM Eval Tools in 2026: 6 Options Tested

awesomeagents.ai/tools/best-llm-eval-tool...

#LlmEvaluation #AiTesting #Deepeval

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

1 month ago

RAG Testing: как не сломать retrieval RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказ...

#rag #ragas #llm #testing #ai #quality #promptfoo #ai #safety #deepeval

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

2 months ago

Тестирование LLM-приложений с DeepEval В этой статье я расскажу о способе написания тестов для LLM-приложений с ис...

#llm #llm-приложения #deepeval #исскуственный #интеллект #llm #тестирование

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

7 months ago

GPT-4o vs YandexGPT: как мы отлаживали метрики в DeepEval из-за требований ИБ В нашей компании мы занимаемся автоматизац...

#deepeval #метрики #качества #llm #релевантность #консистентность #автоматизация #тестирования

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

11 months ago

[Перевод] Инструменты, задачи, рассуждения: как понят...

habr.com/ru/articles/904880/

#ai #agent #ai #агенты #ии-агенты #llm-агент #llm #rag #ai #ии #deepeval

Result Details

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

1 year ago

Интеграция DeepEval для тестирования LlamaIndex Workflow Тестиро...

habr.com/ru/articles/897634/

#llamaindex #workflow #deepeval

Event Attributes

0 0 0 0

Chinstrap Community

@chinstrapcommunity.bsky.social

1 year ago

DeepEval creator describes his COSS startup’s fundraising journey Jeffrey Ip wrote a fascinating blog post describing the whirlwind process of raising a seed round for Confident AI, the COSS startup he co-founded. Confident AI offers an LLM evaluation platform bu…

chinstrap.community/deepeval-cre...

#coss #deepEVal #Entrepreneurship #fundraising #LLM #opensource #oss #startups

1 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

1 year ago

[Перевод] Оценка чат-ботов LLM: основные метрики и мето...

habr.com/ru/articles/876584/

#llm #чат-бот #LLM #DeepEval #Confident #AI

Event Attributes

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

1 year ago

[Перевод] Оценка чат-ботов LLM: основные метрики и мето...

habr.com/ru/articles/876584/

#llm #чат-бот #LLM #DeepEval #Confident #AI

Event Attributes

0 0 0 0