HTML — стандартизированный язык гипертекстовой разметки документов для просмотра веб-страниц в браузере. Веб-браузеры получают HTML документ от сервера по протоколам HTTP/HTTPS или открывают с локального диска, далее интерпретируют код в интерфейс, который будет отображаться на экране монитора.
Консо́рциум Всеми́рной паути́ны — организация, разрабатывающая и внедряющая технологические стандарты для Всемирной паутины. Основателем и главой Консорциума является сэр Тимоти Джон Бернерс-Ли, автор множества разработок в области информационных технологий. По состоянию на 29 мая 2019 года Консорциум насчитывает 444 члена.
Всеми́рная паути́на — распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к сети Интернет. Для обозначения Всемирной паутины также используют слово веб и аббревиатуру WWW.
Человекопонятный URL — URL-путь, состоящий из понятных слов, вместо идентификаторов, и отражающий файловую структуру сайта. Например, вместо /c14/3/97/
или /index.php?cat=10&subcat=2&id=41
используется /product/phone/Samsung/
.
Семанти́ческая паути́на — общедоступная глобальная семантическая сеть, формируемая на базе Всемирной паутины путём стандартизации представления информации в виде, пригодном для машинной обработки.
Сэр Тимоти Джон Бе́рнерс-Ли OM — британский информатик, наиболее известный как создатель URI, URL, HTTP, HTML и Всемирной паутины и действующий глава Консорциума Всемирной паутины. Автор концепции семантической паутины, множества других разработок в области информационных технологий.
Uniform Resource Locator, сокр. URL — адрес ресурса в сети Интернет. Стандарт URL регулируется организацией IETF. URL как формат адреса ресурса был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям, и стал фактической основой для создания Всемирной паутины. Сейчас URL позиционируется как часть более широкой системы адресации URI и регулируется документом, определяющим URI.
URI — унифицированный (единообразный) идентификатор ресурса. URI — последовательность символов, идентифицирующая абстрактный или физический ресурс. Ранее назывался Universal Resource Identifier — универсальный идентификатор ресурса.
Resource Description Framework — это разработанная консорциумом Всемирной паутины модель для представления данных, в особенности — метаданных.
Нотация 3 — широко распространённый краткий способ записи моделей RDF не в XML. Разработан с целью быть понятным человеку: N3 намного компактнее и удобнее для чтения, чем XML-запись RDF. Формат разработан Тимом Бернерсом-Ли и другими из сообщества Семантической паутины.
SPARQL — язык запросов к данным, представленным по модели RDF, а также протокол для передачи этих запросов и ответов на них. SPARQL является рекомендацией консорциума W3C и одной из технологий семантической паутины. Предоставление SPARQL-точек доступа является рекомендованной практикой при публикации данных во всемирной паутине.
Семанти́ческая ви́ки — веб-приложение, использующее машинообрабатываемые данные со строго определённой семантикой для того, чтобы расширить функциональность вики-системы.
OWL — язык описания онтологий для семантической паутины. Язык OWL позволяет описывать классы и отношения между ними, присущие веб-документам и приложениям. OWL основан на более ранних языках OIL и DAML+OIL и в настоящее время является рекомендованным консорциумом Всемирной паутины.
Схема URI file — это схема URI, документированная в RFC 1630, RFC 1738, RFC 3986 и RFC 8089, предназначенная для того, чтобы адресовать файлы на локальном компьютере или в локальной сети, по их прямому пути на диске, в сетевой папке, или, в отдельных случаях, на ftp-сервере. Схема URI file зарегистрирована в реестре схем URI IANA и входит в раздел «Перманентные схемы URI».
Семантическая публикация или публикация в семантическом вебе — размещение информации в Интернете в формате документов, сопровождаемых семантической разметкой. Семантическая публикация даёт возможность поисковым машинам более точно интерпретировать структуру и смысл опубликованной информации, что делает поиск информации в Интернете и интеграции данных более эффективным.
N-Triples (триплеты) — текстовый формат, используемый для хранения и передачи графов RDF, является подмножеством формата Turtle, более простым для обработки парсерами. Данный формат является рекомендованным Консорциумом Всемирной паутины (W3C).
GeoNames — географическая база данных, доступная через различные веб-сервисы по условиям лицензии Creative Commons. Одна из крупнейших и наиболее широко используемых баз геоданных в части названий и координат различных мест.
RDFS (англ. RDF Schema, «схема» RDF), также RDF/S, RDF-S, RDF(S) — набор классов и свойств для модели представления знаний RDF, составляющий основу для описания онтологий с использованием расширенного RDF-словаря для структуры RDF-ресурсов. RDFS использует кодирование в виде RDF, поэтому относящиеся к RDF триплеты могут храниться, обрабатываться и запрашиваться подобно описаниям RDF-ресурсов, например, с помощью SPARQL.
RIF, Rule Interchange Format — стандартный формат Семантической паутины для обеспечения взаимодействия между системами, основанными на правилах. Является рекомендацией W3C с 22 июня 2010 года.
Извлечение знаний — создание знаний из структурированных и неструктурированных источников. Полученное знание должно иметь формат, позволяющий компьютерный ввод, и должно представлять знания так, чтобы облегчить логические выводы. Хотя по методике процесс подобен извлечению информации и процессу «Извлечения, Преобразования, Загрузки», главный критерий результата — создание структурированной информации или преобразование в реляционную схему. Это требует либо преобразования существующего формального знания, либо генерацией схемы, основанной на исходных данных.