taokuizu 405a00bb2c fix:delete the slash at the end of xinference provider server_url (#2730) hai 1 ano
..
_assets d069c668f8 Model Runtime (#1858) hai 1 ano
llm 3a3ca8e6a9 fix: max tokens can only up to 2048 (#2734) hai 1 ano
rerank 405a00bb2c fix:delete the slash at the end of xinference provider server_url (#2730) hai 1 ano
text_embedding ca4aa340f6 fix: Add model_uid validation for model_uid in Xinference models (#2468) hai 1 ano
__init__.py d069c668f8 Model Runtime (#1858) hai 1 ano
xinference.py d069c668f8 Model Runtime (#1858) hai 1 ano
xinference.yaml cca9edc97a feat: ollama support (#2003) hai 1 ano
xinference_helper.py 95733796f0 fix: replace os.path.join with yarl (#2690) hai 1 ano