呆萌闷油瓶 4365843c20 enhance:speedup xinference embedding & rerank (#3587) před 1 rokem
..
_assets d069c668f8 Model Runtime (#1858) před 1 rokem
llm 3a3ca8e6a9 fix: max tokens can only up to 2048 (#2734) před 1 rokem
rerank 4365843c20 enhance:speedup xinference embedding & rerank (#3587) před 1 rokem
speech2text e215aae39a feat:xinference audio model support (#3045) před 1 rokem
text_embedding 4365843c20 enhance:speedup xinference embedding & rerank (#3587) před 1 rokem
__init__.py d069c668f8 Model Runtime (#1858) před 1 rokem
xinference.py d069c668f8 Model Runtime (#1858) před 1 rokem
xinference.yaml e215aae39a feat:xinference audio model support (#3045) před 1 rokem
xinference_helper.py 95733796f0 fix: replace os.path.join with yarl (#2690) před 1 rokem