
tinyvector:纯Rust编写的小型嵌入式数据库
tinyvector:纯Rust编写的小型嵌入式数据库 tinyvector是一个纯Rust编写的小型嵌入式数据库。它非常轻巧,只有大约600行代码,非常容易定制。在处理小到中等规模的数据集时,它的速度应该与高级向量数据库相当,并且准确性稍...
tinyvector:纯Rust编写的小型嵌入式数据库 tinyvector是一个纯Rust编写的小型嵌入式数据库。它非常轻巧,只有大约600行代码,非常容易定制。在处理小到中等规模的数据集时,它的速度应该与高级向量数据库相当,并且准确性稍...
Equals:AI辅助数据分析 Equals是一款可以直接从数据库中获取数据进行分析的工具,无论你是否了解SQL。它与本地数据连接,构建和自动化分析更加简单,提供从群组报告到漏斗审查再到董事会报告的各种分析。它具有零学习曲线,使用方式类似于...
Found:AI图像资产管理和编辑工具 国产的一款AI资产编辑工具,几乎支持现在常见的各类多媒体编辑功能,还有AI的相关能力,很多都是SD的能力再次打包,不过体验做的还可以。
大语言模型(LLM)后训练数据准备相关笔记 本文是关于对LLM进行微调和二次预训练时的学习笔记,包含了一些经验总结。参考资料包括了流程化大语言模型数据准备、OpenAI微调文档等。
Visual Navigation Transformer ViNT是一个目标条件的导航策略,通过多样化的跨体培训数据进行训练,可以零-shot控制许多不同的机器人。它还可以高效地进行微调或适应新的机器人和下游任务。ViNT使用Transf...
使用ChatGPT来丰富数据 在这个视频中,作者测试了ChatGPT是否可以用于数据库的数据丰富。在这个具体的例子中,作者提交了一个不完整的街道地址,并使用ChatGPT为该地址的州、邮编和国家代码进行了数据丰富。
扩展LLMs的上下文窗口 本文介绍了一种称为位置插值(PI)的方法,可以将基于RoPE的预训练LLM的上下文窗口大小扩展到32768个位置,并在各种任务上展示了强大的实证结果。该方法通过线性缩小输入位置索引来实现扩展,同时保持了模型在原始上...
LeanDojo : 一个开源精益游乐场 由用于定理证明的工具包、数据、模型和基准组成;还开发了 ReProver,这是一种基于 LLM 的检索增强证明器,用于使用庞大数学库中的前提进行定理求解。
开源人工智能至关重要:HF CEO 美国国会质询内容 Hugging Face首席执行官Clement Delangue在美国国会科学委员会的听证会上表示,开放科学和开源人工智能对激励和与美国的价值和利益高度一致。Delangue还指出,今...
使用LangChain、Activeloop和GPT-4逆向工程Reddit源代码的简明指南 本文介绍了使用GPT-4和Activeloop与Langchain代码理解技术来逆向工程Reddit的公开源代码的指南。LangChain是一个强...