青空文库(日语:青空文庫/あおぞらぶんこ Aozora Bunko */?)是搜集了日本国内著作权已经进入公有领域的文学作品的数字图书馆,由富田伦生、野口英司、八卷美惠、らんむろ・さてぃ四人发起创立,被每日新闻誉为将日本国内公有领域文学作品数字化的先驱。2015年访问量累计达880万次以上。
收录作品由志愿者在JIS X 0208汉字编码规格内以青空文库格式文本文件用Html格式电子化。为了让人能够在遵守《青空文库收录文件的使用规定》下自由利用,收录作品在个人电脑、PAD、手机上也能够使用。
虽然青空文库没有提供阅读软件,但电子辞典、iPhone都已经有开发出阅读文库用的第三方应用程序。
日本著作权法规定,一般而言,著作人死后70年著作权将消失(2018年前为50年)。故青空文库目前搜集的作品以明治至昭和初期居多,也包含有一些外文译本和作者允许免费阅读的现代作品。藏书类型包含广泛,从政治到各种兴趣都有,但文学作品(包含时代小说、侦探小说等娱乐作品)较多。虽然不是所有名作都有收录,但日文作品可谓相当充实(外文作品因著作权的关系数量相当少)。小众的作品也有保存和介绍。作品的电子化仍在进行中,
直至2016年11月时,收录了约13900份文献,其中包括了森鸥外(1922年过世)、夏目漱石(1916年)、芥川龙之介(1927年)、中岛敦(1942年)、太宰治(1948年)、林芙美子(1951年)、宫本百合子(1951年)、堀辰雄(1953年)、坂口安吾(1955年)、高村光太郎(1956年)、永井荷风(1959年)的作品。
青空文库是由志愿者所营运的,免费阅读。一开始的服务器是由VOYAGER公司所提供。1998年到1999年之间富田制定了作业规则及入门指引。
录入及校正是由志愿者进行。录入方式是看着底本手动输入或是扫描后再进行光学识别。录入作品的“录入者”及校正作品的“校正者”是由不同人担任。从录入完成之后到校正者预约校正的状态叫做“等待校正”,这时工作状态是停止的。录入完成但没有校正的作品是不能公开的。
与录入者相比校正者不足,这是青空文库从创立开始就持续存在的问题,也因此录入完成但等待校正的作品不断增加。为此,有人提出认可由录入者对没人校对的作品进行校正的方案,但目前为止没有被采用。为了解决这个问题,从2011年12月16日后公开的作品开始,以捐款做为资金付费请人校正。
2013年8月创立者之一的富田过世。以此为契机,支持青空文库营运为目的的“书的未来基金”设立。2015年在没工程师的状况下,勉强使用服务器,但是也面临了服务器老化等问题。为此,同年五月“‘Code for 青空文库’点子马拉松”活动发起,进行关于今后系统运用相关的意见交流。之后该活动持续进行着母体、系统管理和代码修复等“aozorahack”任务。