SiliconFlow, Inc dc650c5368 Fixes #12414: Add cheaper model and long context model for Qwen2.5-72B-Instruct from siliconflow (#12415) hace 9 meses
..
__base 6f5a8a33d9 refactor: replace gevent threadpool with ProcessPoolExecutor in GPT2Tokenizer (#12316) hace 9 meses
anthropic 2681bafb76 fix: handle document fetching from URL in Anthropic LLM model, solving base64 decoding error (#11858) hace 9 meses
azure_ai_studio 51db59622c chore(lint): cleanup repeated cause exception in logging.exception replaced by helpful message (#10425) hace 11 meses
azure_openai c98d91e44d fix: o1 model error, use max_completion_tokens instead of max_tokens. (#12037) hace 9 meses
baichuan daccb10d8c fix: volcengine_maas and baichuan message error (#11625) hace 10 meses
bedrock 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
chatglm 40fb4d16ef chore: refurbish Python code by applying refurb linter rules (#8296) hace 1 año
cohere 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
deepseek 79801f5c30 fix: deepseek reports an error when using Response Format #11677 (#11678) hace 10 meses
fireworks 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
fishaudio 448a19bf54 fix: fish audio wrong validate credentials interface (#11019) hace 10 meses
gitee_ai 6df17a334c fix: Update the API call address for the text_embedding model (#12342) hace 9 meses
google 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
gpustack 2bb521b135 Support TTS and Speech2Text for Model Provider GPUStack (#12381) hace 9 meses
groq d7c0bc8c23 feat: Add response format support for openai compat models (#12240) hace 9 meses
huggingface_hub 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
huggingface_tei 6a0ff3686c fix: fix typo (#12034) hace 9 meses
hunyuan baeddd4d15 feat:Add support for stop parameter in hunyuan model #12313 (#12315) hace 9 meses
jina 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
leptonai 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) hace 1 año
localai 1e829ceaf3 chore: format get_customizable_model_schema return value (#9335) hace 11 meses
minimax 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
mistralai 42d986b96d [Pixtral] Add new model ; add vision (#11231) hace 10 meses
mixedbread b90ad587c2 refactor: move the embedding to the rag module and abstract the rerank runner for extension (#9423) hace 1 año
moonshot 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) hace 9 meses
nomic 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
novita 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) hace 1 año
nvidia b90ad587c2 refactor: move the embedding to the rag module and abstract the rerank runner for extension (#9423) hace 1 año
nvidia_nim 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) hace 1 año
oci 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
ollama 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
openai d7c0bc8c23 feat: Add response format support for openai compat models (#12240) hace 9 meses
openai_api_compatible 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) hace 9 meses
openllm 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
openrouter 4d6b45427c Support streaming output for OpenAI o1-preview and o1-mini (#10890) hace 10 meses
perfxcloud 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
replicate 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
sagemaker 147d578922 [Fix] revert sagemaker llm to support model hub (#12378) hace 9 meses
siliconflow dc650c5368 Fixes #12414: Add cheaper model and long context model for Qwen2.5-72B-Instruct from siliconflow (#12415) hace 9 meses
spark 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
stepfun 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) hace 9 meses
tencent 40fb4d16ef chore: refurbish Python code by applying refurb linter rules (#8296) hace 1 año
togetherai 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
tongyi 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
triton_inference_server 1e829ceaf3 chore: format get_customizable_model_schema return value (#9335) hace 11 meses
upstage 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
vertex_ai 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
vessl_ai 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
volcengine_maas 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
voyage 8aae235a71 fix: int None will cause error for context size (#11055) hace 10 meses
wenxin 2a909e634b feat: support Ernie-lite-pro-128k (#12161) hace 9 meses
x cf0ff88120 feat: add grok-2-1212 and grok-2-vision-1212 (#11672) hace 10 meses
xinference 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
yi 56e15d09a9 feat: mypy for all type check (#10921) hace 9 meses
zhinao 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) hace 1 año
zhipuai 7c1961e618 feat: Add response format support to GLM-4 (#12252) hace 9 meses
__init__.py d069c668f8 Model Runtime (#1858) hace 1 año
_position.yaml fb49413a41 feat: add voyage ai as a new model provider (#8747) hace 1 año
model_provider_factory.py 4e7b6aec3a feat: support pinning, including, and excluding for model providers and tools (#7419) hace 1 año