书籍文献数据
书籍和文献是深度知识的重要来源,提供系统性、专业性的知识内容。
公共领域书籍
Project Gutenberg
提供超过6万本公共领域电子书,主要是版权过期的经典文学作品。
开放图书馆
Internet Archive的开放图书馆项目,提供大量可借阅的数字化图书。
学术论文数据
arXiv
开放获取的学术论文预印本平台,主要覆盖物理、数学、计算机科学等领域。
PubMed
生物医学文献数据库,提供论文摘要和部分全文。
Semantic Scholar
AI驱动的学术搜索引擎,提供论文数据和引用关系。
技术文档
软件文档、技术规范、标准文档等是学习技术知识的重要来源:
- 编程语言官方文档
- 框架和库的API文档
- 技术标准和规范
版权考虑
版权合规要点
- 使用公共领域或开放许可的内容
- 遵守合理使用原则
- 获取必要的授权许可
- 标注数据来源和许可信息