
Архи́в Интерне́та — некоммерческая организация, основанная в 1996 году в Сан-Франциско американским программистом Брюстером Кейлом. Главной заявленной целью Архива является предоставление всеобщего доступа к накопленной в Интернете информации. Коллекция АИ состоит из множества подколлекций архивированных веб-сайтов, оцифрованных книг, аудио- и видеофайлов, игр, программного обеспечения.
Библиоте́ка Макси́ма Мошко́ва — русскоязычная электронная библиотека в Интернете, одна из первых и наиболее известных подобных библиотек в Рунете.
Электро́нная библиоте́ка — упорядоченная коллекция разнородных электронных документов, снабжённых средствами навигации и поиска. Может быть веб-сайтом, где постепенно накапливаются различные тексты и медиафайлы, каждый из которых самодостаточен и в любой момент может быть востребован читателем. Электронные библиотеки могут быть универсальными, стремящимися к наиболее широкому выбору материала, и более специализированными, как Фундаментальная электронная библиотека или проект Сетевая Словесность, нацеленный на собирание авторов и типов текста, наиболее ярко заявляющих о себе именно в Интернете.

Прое́кт «Гу́тенберг» — общественная некоммерческая инициатива, направленная на создание и распространение цифровой коллекции находящихся в общественном достоянии произведений. «Гутенберг» считается старейшей в мире электронной библиотекой. Большинство работ было оцифровано волонтёрами и доступны для свободного скачивания.
Creative Commons, сокращённо CC — некоммерческая организация, которая создала бесплатные для использования типовые договоры — свободные и несвободные публичные лицензии, с помощью которых авторы и правообладатели могут выразить свою волю и распространять свои произведения более широко и свободно, а потребители контента — легально и проще пользоваться этими произведениями.

Google Книги — масштабный проект компании Google, запущенный в 2004 году и направленный на оцифровку и публикацию в интернете миллионов печатных произведений. Основная идея заключалась в том, чтобы сделать все когда-либо напечатанные книги доступными для чтения и поиска в интернете, обеспечив пользователям неограниченный доступ к знаниям. В 2010 году Google сообщила, что, по её оценкам, в мире насчитывается более 129 млн печатных изданий, которые компания планирует полностью оцифровать за 10 лет.

Оцифровка книг — это процесс перевода бумажных книг в электронный (цифровой) вид. Электронные копии книг могут образовывать электронные библиотеки и распространяться в Сети. Цифровые книги можно легко распространять, воспроизводить и читать на экране. Обычно оцифрованные книги сохраняют в форматах: DjVu, Portable Document Format (PDF), JPG или TIFF. Для преобразования исходного изображения используют оптическое распознавание символов (OCR), оно необходимо для включения страниц книги в цифровой формат, такой, как ASCII, или другой подобный формат, который уменьшает размер файла и позволяет работать с текстом. Сканирование изображений может происходить вручную или автоматически. В обычных сканерах книга располагается на стекле, на книгу падает свет, и оптический механизм сканирует книгу, двигаясь под стеклом. Другие книжные сканеры используют V-образную раму и фотографируют страницы сверху. Страницы могут переворачиваться вручную или с помощью автоматических устройств подачи бумаги. Специальное массивное стекло, как правило, прижимает страницы, чтобы сгладить недостатки сканирования. После сканирования программа корректирует изображение документа, выравнивая его, обрезая, редактируя и преобразовывая его в текст, и окончательную форму электронной книги. Люди обычно проверяют отсканированное изображение на наличие ошибок.

Откры́тый до́ступ — собирательный термин, обозначающий ряд принципов и практик, которые обеспечивают бесплатный, оперативный, постоянный, полнотекстовый онлайн доступ к научным публикациям. Будапештская инициатива открытого доступа определяет работы в ОД как размещённые в интернете и открытые для чтения, копирования, распространения и сканирования. Помимо этого, пользователи могут использовать их в качестве данных для программного обеспечения, или для любых законных целей, без каких-либо ценовых, юридических или технических барьеров. При этом авторы имеют право на осуществление контроля за целостностью работы, а также на надлежащую атрибуцию. Главной целью ОД является устранение любых ограничений доступа к научному знанию.
Bridgeman Art Library против корпорации Corel — иск Бриджменской библиотеки искусств против корпорации Corel, поданный в Федеральный окружной суд Южного округа Нью-Йорка, который постановил, что точные фотографические копии изображений, находящихся в общественном достоянии, не могут быть защищены авторским правом, потому что в них отсутствует новизна. Даже если точное воспроизводство требует большого количества навыков, опыта и усилий, ключевым элементом для того, чтобы материал мог охраняться авторским правом согласно американскому закону, является обладание им достаточной новизной.
Электро́нное архиви́рование — ряд практик, стратегий и рабочих процессов по защите электронных документов от устаревания и потери информации. Деятельность по архивации цифровых данных направлена на создание, обслуживание и сохранение целостности цифровой информации. Для обозначения практик электронного архивирования используют несколько терминов — digital preservation, digital archiving или digital management. Зачастую эти понятия употребляют как взаимозаменяемые, однако использование отдельных терминов зависит от страны.
Галлика́ — онлайн-библиотека Национальной библиотеки Франции. Все материалы библиотеки находятся в свободном доступе. Библиотека содержит следующие виды документов: книги, журналы, газеты, фотографии, карикатуры, плакаты, карты, рукописи, партитуры, аудиоматериалы, книжные миниатюры.

Open Library — проект виртуальной библиотеки, созданный в 2006 году некоммерческой организацией «Архив Интернета». OL ставит перед собой две главные цели — предоставить пользователю максимальное количество информации о запрашиваемом издании, через pdf-версию или ссылку для его приобретения, а также собрать информацию о каждой когда-либо выпущенной книге. Над проектом работали, среди прочих, создатель «Архива» Брюстер Кейл и американский интернет-активист Аарон Шварц. Финансирование осуществлялось за счёт грантов библиотеки штата Калифорния и Kahle/Austin Foundation.
Open Content Alliance (OCA) — консорциум коммерческих и некоммерческих организаций, занимающийся оцифровкой печатных изданий для свободного распространения в интернете. Создан в октябре 2005 года в качестве альтернативы проекту Google Books. Главными партнёрами-сооснователями стали Архива Интернета, Yahoo, библиотеки Университета Торонто и Калифорнийского университета, а также Национальные архивы Великобритании. Спустя несколько недель к проекту присоединился Microsoft, Research Libraries Group, Biodiversity Heritage Library, Библиотеки и архивы Смитсоновского института. К 2008 году в OCA входило около 80 организаций. К 2010 году работа OCA окончательно остановилась из-за выхода из консорциума Microsoft и Yahoo. На 2023 год OCA больше не занимается оцифровкой материалов.
Цифровы́е гуманита́рные нау́ки — область исследований, обучения и созидания на стыке компьютерных и гуманитарных наук. Цифровые гуманитарные науки предполагают использование оцифрованных материалов и материалов цифрового происхождения и объединяют методологии из традиционных гуманитарных наук с компьютерными науками, предоставляя компьютерные инструменты и открывая новые возможности для сбора и визуализации данных, информационного поиска, интеллектуального анализа данных, а также применения математической статистики.
Авторское право в Соединённых Штатах Америки поощряет создание произведений искусства и культуры, поощряя авторов и правообладателей множеством эксклюзивных прав. Закон об авторском праве предоставляет авторам исключительное право производить и продавать копии своих работ, право на создание производных произведений, а также защищает правообладателя. У авторских прав в Соединённых Штатах есть срок, и, как правило, он истекает спустя 70 лет после смерти автора. После этого произведения переходят в общественное достояние.

Copyfraud — термин, описывающий ложные претензии авторов или учреждений в отношении произведений, находящихся в общественном достоянии. Такие действия являются неправомерными, так как работы, перешедшие в общественное достояние, абсолютно бесплатны, их можно свободно воспроизводить, изменять и использовать. Также copyfraud означает ущемление прав настоящего владельца авторских прав, наложение на него ограничений, не предусмотренных законом.

Произведение с недоступным правообладателем является защищенным авторским правом произведением, владельца прав на которое невозможно определить или с которым невозможно установить контакт. Данные ограничения часто означают, что такие «бесхозные произведения» не могут быть использованы в новых работах либо подвергнуты оцифровке, за исключением случаев, когда могут быть применены исключения, связанные с добросовестным использованием. Проблему использования таких произведений неоднократно пытались решить в США. Однако до недавнего времени публичные библиотеки не могли распространять в цифровом виде «бесхозные» книги из-за риска быть оштрафованными на сумму до $150 000, если владелец авторских прав обнаруживал себя. Вопрос рассматривался в деле Authors Guild et al. v. Google в 2011 году.
Электронное издательство ― тексты, создаваемые в цифровом виде, публикуемые и распространяемые в сети Интернет. Также включает в себя публикацию электронных книг, онлайн-журналов, создание электронных библиотек и каталогов, а также редактирование книг, журналов для размещения на экране компьютера, «электронной читалки», планшета или смартфона).
Контролируемая цифровая выдача – метод, в рамках которого библиотеки оцифровывают свои коллекции и предоставляют доступ читателям. Система является цифровым эквивалентом получения книги в традиционной библиотеке – к выдаче доступно лишь столько копий, сколько у библиотеки есть в печатном виде. Если пользователь хочет прочитать произведение, но все доступные экземпляры уже взяты, он попадает в лист ожидания. Читатели не могут сохранять или копировать файлы, так как доступ к материалам контролируется средствами защиты авторских прав. Проект Open Library, созданный Архивом Интернета в 2010 году, является наиболее известным примером применения CDL.
В 2020-х годах быстрое увеличение возможностей генеративных моделей искусственного интеллекта на основе глубокого обучения, включая модели преобразования текста в изображение, такие как Stable Diffusion, и больших языковых моделей, таких как ChatGPT, ставит вопросы о том, как закон об авторском праве применяется к обучению и использованию таких моделей. Поскольку существующее прецедентное право ограничено, эксперты считают, что в этой области царит неопределенность.