Определение. Как создавался проект. Применение викисловарей в задачах автоматической обработки текста и речи

URL Коммерческий Тип сайта Регистрация Язык(-и) Расположение сервера Владелец Автор Начало работы
Викисловарь
Wiktionary

www.wiktionary.org

Сетевой словарь

Необязательная

Фонд Викимедиа

Джимми Уэйлс

Викисловарь на Викискладе

Викислова́рь (англ. Wiktionary ) - свободно пополняемый многофункциональный многоязычный словарь и тезаурус, основанный на вики-движке. Один из проектов фонда «Викимедиа». Сначала появился на английском языке 12 декабря 2002 года.

Данные викисловарей активно используются при решении различных задач, связанных с машинной обработкой текста и речи[⇨].

Лексикографическая концепция

Благодаря взаимосвязи между разными языковыми разделами Wiktionary, а также между участниками словарного и других проектов «Фонда Викимедиа», участники каждого из них могут использовать концепции, инструменты и лексикографические материалы, созданные их коллегами - носителями других языков. В ходе работы над различными языковыми разделами словаря сложилась комплексная концепция универсального лексикографического ресурса, ставшая впервые возможной благодаря электронным технологиям. Концепция предполагает в конечном итоге полное, всестороннее описание всех лексических единиц всех естественных (и основных искусственных) языков, имеющих письменность. Полнота описания означает наличие сведений о фонетике, морфологии, синтаксических и семантических свойствах лексической единицы, её этимологии, сочетаемости и фразеологии. Полнота и степень последовательности реализации этой концепции может варьироваться в разных языковых разделах проекта.

В каждом языковом разделе «титульный» язык является центральным - все статьи пишутся исключительно на нём, кроме того, ставится цель дать переводы слов и других единиц этого языка на максимально возможное число других языков. Слова других языков переводятся, как правило, только на этот «титульный» язык. Так, в русском Викисловаре для русских слов даются толкования и переводы на иностранные языки, для иностранных слов вместо толкований даются переводы на русский язык.

При описании морфологии делается попытка дать максимально полную картину словоизменения, включая указание класса словоизменения. В частности, морфологические сведения по русским лексемам даются в соответствии с классификацией, предложенной А. А. Зализняком.

Для пополнения Викисловаря создан обширный список литературы, в Английском Викисловаре выработаны правила по включению термина в словарь (см. Criteria for inclusion). В отличие от русской Википедии, где приоритет при подборе материала отдаётся авторитетным источникам[Прим 1], в русском Викисловаре превалирует проведённый редактором статьи анализ словоупотребления[Прим 2].

Тезаурус

Викисловарь содержит следующие семантические отношения: синонимы, антонимы, гиперонимы, гипонимы, согипонимы, холонимы, меронимы, паронимы.

Википедия и Викисловарь

Викисловарь не включает подробного описания фактов и энциклопедической информации. Тем не менее Викисловарь предоставляет уникальную информацию, отсутствующую в Википедии: словосочетания, поговорки, аббревиатуры, акронимы, описание ошибок правописания, упрощённые/искажённые варианты написания / произнесения слов, спорные случаи употребления, протологизмы, ономатопею, разные стили (напр., разговорный) и предметные области. Таким образом, Википедия и Викисловарь дополняют друг друга.

Викисловарь сходен с Википедией в том, что (1) есть внутренние ссылки на статьи о словах внутри Викисловаря, (2) есть категории, (3) есть интервики, ссылающиеся на статьи о том же слове в иноязычном словаре.

Связывание проектов

В Викисловаре есть статья «Викисловарь»

Участникам Википедии рекомендуется добавлять в статьи шаблон «викисловарь» (например, {викисловарь}) для связывания с соответствующей статьёй Викисловаря. Чтобы сделать обратную ссылку на странице Викисловаря, используется шаблон «википедия» (например, {википедия}).

Применение таких шаблонов позволяет сгладить острые углы проблемы «энциклопедия или словарь» и делает доступ к информации удобнее, поскольку предоставляет ссылку на дополнительную лингвистическую информацию о термине в энциклопедии, и, наоборот, даёт ссылку на глубокое описание значения слова в словаре, в целом улучшая «связность» статей в проектах Фонда Викимедиа.

Если требуется указать ссылку на определение слова непосредственно в тексте статьи (шаблон «викисловарь» добавляет целый блок), используются межпроектные интервики-ссылки, которые задаются следующим образом: [] или более коротко [[:wikt:слово|]] и выглядят так: слово.

Русскоязычный раздел

Динамика развития русского Викисловаря

Русский раздел Wiktionary был создан весной 2004 года. На протяжении полутора лет он практически не развивался, пополняясь бессистемно, преимущественно недоброкачественным материалом. Ситуация начала меняться в конце 2005 - начале 2006 годов.

В 2006 году был назначен первый администратор, объём статей увеличился почти в четыре раза по сравнению с предыдущим годом, создан мощный инструментарий для описания морфологии, начала формироваться развитая система семантических категорий.

К осени 2006 года число статей в русском Викисловаре достигло 10 000; затем, благодаря созданию бота, использующего словники других разделов Wiktionary для генерации статей-болванок в русском разделе, за полтора месяца было добавлено ещё около 70 000 статей. 7 ноября 2006 года Викисловарь преодолел отметку 80 000, а 10 декабря 2006 года был взят рубеж в 100 000 статей. 21 марта 2009 года количество статей выросло до 200 000. Число активных участников составило порядка 20.

В отличие от ситуации с традиционными словарями полнота Викисловаря не может быть адекватно оценена по формальному показателю количества статей. Автоматический счётчик не делает различий между полупустыми болванками и по-настоящему информативными статьями, кроме того, он не учитывает внутриязыковую и межъязыковую омонимию. К примеру, словарный вход бор числится как одна статья, между тем в этой статье описано несколько омонимичных лексем русского языка, а также одноименные лексемы других языков (болгарского, татарского), - в традиционных словарях этот материал был бы оформлен и учтён в виде нескольких статей.

Сравнение с другими Викисловарями

Число русских слов в Русском Викисловаре (слева) и в Английском Викисловаре (справа), данные на 2011 год

Начиная с августа 2008 года русский Викисловарь вышел на первое место по размеру базы данных среди всех викисловарей. В то же время, количество статей в русском Викисловаре не самое большое. Это отчасти объясняется тем, что у проектов, в которых статей больше, чем в русском Викисловаре, статьи могут иметь в среднем меньший размер, в чём можно убедиться на сайте статистики. Кроме того, русский Викисловарь по сравнению с другими разделами Wiktionary содержит большее количество вспомогательной информации, включая справочные таблицы, списки частотных слов и т. п. (в отличие от словарных статей, составляющих так называемое основное пространство имён, такая информация размещается в разделах «Приложения», «Индексы» и т. п.). Значительное количество статей в русском Викисловаре всё ещё являются болванками, сгенерированными ботами. Хотя иногда и можно встретить критику большого количества статей-болванок, такая предварительная разметка даёт много преимуществ. Во-первых, она помогает быстрее создавать статьи за счёт предварительного включения некоторой информации, типа части речи описываемого слова. Во-вторых, структура статей стандартизируется. За счёт повсеместного применения шаблонов (которые обычно сразу проставляются ботами при автоматическом создании статей) возникает возможность централизованно менять внешний вид сразу многих статей. Наличие большого количества шаблонов также помогает проводить дальнейшее автоматизированное редактирование уже созданных статей - например, автоматически проставлять перевод по заранее подготовленным словарям (так как ботам легче ориентироваться в структуре статьи, уже размеченной специализированными конструкциями, а не человеческим языком). Отличительной особенностью русского Викисловаря является проработанная концепция развития (которую можно найти на главной странице). Из-за проработанной концепции и широкого применения шаблонов, статьи в русском Викисловаре выглядят более однотипно, чем во многих других проектах (в основном одинаковы количество разделов, порядок их следования, оформление каждого раздела).

Авторами было подсчитано число словарных статей о русских словах, число статей с толкованиями и без них - в двух Викисловарях (на иллюстрации). Политика редакторов Английского Викисловаря (не создавать статей-заготовок) подтвердилась: словарных статей о русских словах без толкований всего 5,57 %. В Русском Викисловаре таких статей - 60,39 %. Однако в Русском Викисловаре (по данным на 2011 год) почти в 3.4 раза больше словарных статей с толкованиями для русских слов, чем в Английском Викисловаре: 53.6 тысячи против 15.7 тысяч.

Применение викисловарей в задачах автоматической обработки текста и речи

Для использования лексикографических данных викисловарей при решении задач автоматической обработки текста и речи - необходимо преобразовать тексты словарных статей (слабоструктурированные данные) в машиночитаемый формат.

Извлечение данных из викисловарей является непростой задачей. Можно выделить следующие трудности: (1) регулярное и частое изменение как данных, так и самой структуры статей, (2) разные викисловари имеют различную структуру и формат статей[Прим 3], (3) технология вики изначально ориентирована на удобство работы человека, а не на машинную обработку.

Существует несколько парсеров для разных викисловарей:

  • DBpedia Wiktionary - одно из расширений проекта DBpedia, данные извлекаются из Английского, Французского, Немецкого и Русского Викисловарей. Извлекаются: язык, часть речи, толкование, семантические отношения, переводы. Для извлечения данных используются: декларативное описание структуры словарной статьи, регулярные выражения и FST-разновидность конечного автомата.
  • JWKTL (Java Wiktionary Library) - API к данным Английского и Немецкого Викисловарей. Извлекаются: язык, часть речи, толкование, цитаты, семантические отношения, этимология и переводы. Программа доступна для некоммерческого использования.
  • wikokit - парсер Английского и Русского Викисловарей. Извлекаются: язык, часть речи, толкование, цитаты (только для Русского Викисловаря), семантические отношения и переводы. Исходный код программы доступен на условиях открытой мульти-лицензии.

С помощью викисловарей решаются разнообразные задачи, связанные с обработкой текста и речи:

  • машинный перевод на основе правил между нидерландским и языком африкаанс; используются данные Английского и Нидерландского Викисловарей и двух википедий в рамках системы Apertium;
  • создание машиночитаемого словаря парсером NULEX, интегрирующего открытые лингвистические ресурсы: Английский Викисловарь, WordNet и VerbNet. Для существительного из Английского Викисловаря извлекались часть речи и форма множественного числа, для глаголов - время. Для извлечения данных из Викисловаря использовалась методика Screen scraping;
  • распознавание и синтез речи, где Викисловарь выступает в роли источника данных для автоматического построения словаря произношений. Извлекаются пары слово-произношение (транскрипция в системе МФА) из Чешского, Английского, Французского, Немецкого, Польского и Испанского Викисловарей[Прим 4]. При проверке самое большое число ошибок оказалось в транскрипциях, извлечённых из Английского Викисловаря;
  • построение онтологий и баз знаний;
  • отображение онтологий;
  • упрощение текста. В работе выполняется оценка сложности слов на основе данных Викисловаря. Для слова из Английского Викисловаря извлекаются: размер словарной статьи, число частей речи, число значений и число переводов. Авторы предположили, что более простыми, базовыми, употребимыми будут те слова, у которых больше значений (то есть размер статьи будет больше), больше частей речи и больше переводов. Далее найденные в тексте «сложные» слова необходимо перефразировать, найти более «простые» эквиваленты, что приведёт к упрощению (адаптации) текста;
  • частеречная разметка. В работе (Ли и др., 2012) на основе данных Английского Викисловаря построены POS-tagger’ы для восьми языков, имеющих «бедные лингвистические ресурсы», с использованием скрытых марковских моделей.[Прим 5]
  • анализ тональности текста.

Комментарии

  1. Википедия:Авторитетные источники

    Статьи в Википедии должны основываться на опубликованных авторитетных источниках .

  2. Викисловарь: Лексикографическая концепция

    При наличии разногласий относительно каких-либо описываемых свойств какой-либо языковой единицы приоритет (с точки зрения доказательности) отдаётся корпусным источникам.

  3. Сравните, например, структуру и правила оформления статей в Английском Викисловаре и Русском Викисловаре.
  4. Если в словарной статье несколько транскрипций, то берётся первая.
  5. Исходный код программы и результаты частеречной разметки доступны онлайн: https://code.google.com/p/wikily-supervised-pos-tagger

Слово это:

Слово У этого термина существуют и другие значения, см. Слово (значения).

Слово (однозначное аксиоматическое обозначение в лексике) - одна из основных структурных единиц языка, которая служит для именования предметов, их качеств и характеристик, их взаимодействий, а также именования мнимых и отвлечённых понятий, создаваемых человеческим воображением.

В поисках структуры слова современная наука сформировала самостоятельную отрасль, называемою морфологией. По грамматическому значению слова классифицируются как части речи:

  • знаменательные слова - обозначающие определённые понятия, - существительное, прилагательное, глагол, наречие;
  • подклассы - числительные, местоимения и междометия;
  • служебные слова - служащие для связи слов между собой - союз, предлог, частица, артикль и др.

По лексическому значению слова классифицируются по возрастающему перечню по мере развития лексикологии, семантики, учения о словообразовании, этимологии и стилистики.

С исторической точки зрения слова, составляющие лексику языка, обычно имеют самые различные происхождения, и в этом многообразии истоков особо перспективной для фундаментальных исследований становится сочетание предметов терминология и этимология которое способно восстановить истинное происхождение знаменательных слов.

Понятие «слово» в научном употреблении является основополагающим понятием (аксиомой) в лингвистике.

Все иносказательные употребления обозначения этого понятия являются примерами употребления данного понятия в других областях человеческой деятельности, для которых автор или не может найти соответствующего обозначения своей мысли, или считает введение нового обозначения ненужным. Так что любые иносказательные употребления данного обозначения необходимо считать обиходным языком общения, допускающим несущественные отклонения от грамотности и общей образованности. Как правило, такая необходимость возникает при изложении субъективной или эмоциональной речи, как неотъемлемой части человеческого быта.

Основные свойства

Словами обозначаются конкретные предметы и отвлечённые понятия, выражаются человеческие эмоции и воля, называются «общие, абстрактные категории бытийных отношений» и т. д. Тем самым слово выступает в качестве основной значимой единицы языка. Подобно всякому другому языку, русский язык как средство общения является языком слов. Из слов, выступающих отдельно или в качестве компонентов фразеологических оборотов, формируются при помощи грамматических правил и законов предложения, а затем и текст как структурно-коммуникативное целое.

Учитывая сложность и многоплановость структуры слова, современные исследователи при его характеристике используют т. н. многоаспектный тип анализа, то есть указывают на сумму самых разных языковых свойств:

  • Фонетическая оформленность и одноударность (наличие главного ударения).
  • Семантическая оформленность (наличие лексического, грамматического, структурного значения).
  • Номинативная функция (название явления реальной действительности и представление его в виде лексического значения).
  • Воспроизводимость (слово существует в языке как готовая самостоятельная единица и воспроизводится говорящим в момент речи, а не изобретается заново).
  • Синтаксическая самостоятельность (способность употребляться в качестве отдельного высказывания; относительная свобода расположения слов в предложении).
  • Внутренняя линейная организация (слово состоит из морфем).
  • Непроницаемость и неделимость (невозможность разрыва единицы какими-либо элементами). Исключения: никто - ни от кого и т. п.
  • Цельнооформленность.
  • Семантическая валентность (способность сочетаться с другими словами по определенным семантическим * грамматическим законам).
  • Лексико-грамматическая отнесённость.
  • Материальность (существование слова в звуковой/графической оболочке).
  • Информативность (объём знаний о явлении мира действительности).

Классификация

По значению

  • знаменательные (обозначающее некоторое понятие);
  • служебные (служат для связи слов между собой).

Части речи

Слова подразделяются также на разные части речи.

По происхождению

  • Исконные (существовавшие в том или ином виде в языке-предке)
  • Заимствованные (пришедшие из какого-то иностранного языка)

По составу

  • Простые
  • Сложные

По употреблению

  • Общеупотребительные
  • Устаревшие
    • Историзмы - устарели в связи с исчезновением предмета (опричник )
    • Архаизмы - заменены другим словом (уста )
  • Неологизмы - малоупотребляемые из-за новизны
  • Термины - специальные слова, употребляемые людьми определённых профессий для обозначения понятий, с которыми они имеют дело
  • Арго, жаргон, сленг - слова, употребляемые при неформальном общении определёнными социальными, профессиональными и возрастными группами
  • Просторечные слова - употребляются малообразованными людьми независимо от социальной группы
  • Табуированные слова
    • Эвфемизмы - слова для замены табуированных
  • и т. д.

Значения

У слова существует грамматическое и лексическое значения.

Лексическое значение - это соотнесённость слова с каким-либо явлением объективной действительности, исторически закреплённую в сознании говорящих.

Лексическое значение может быть единственным (слова с одним значением называют однозначными: подоконник, метла, шея, чреватый и т. д.). Но оно может быть в слове наряду с другими лексическими значениями (слова с такой семантикой называют многозначными: знать, корень, отбить и т. д.).

Существует три основных типа лексических значений:

  1. прямое (номинативное);
  2. фразеологически связанное;
  3. синтаксически обусловленное.

Многозначность (или полисемия) представляет собой следствие переноса наименования с одного предмета на другой. Такие переносы происходят:

  1. на основе сходства;
  2. по смежности;
  3. по функции;

Основные виды переносных значений:

Демоника off

Слово «Википедия» состоит из двух слов, а именно, слова «вики» , которое с гавайского переводится «быстро» и из греческого слова «παιδεία» [педиа] , что означает – «обучение» .

На данный момент Википедия является самой крупной энциклопедией созданной за всю историю интернета.

Википедия - многоязычный проект, позволяющий всем желающим добавлять, редактировать и просматривать статьи на различные темы. Ее создателями являются Джимбо Уэллс и Ларри Сэнгер. До образования Википедии, Джимбо и Ларри создали малоизвестный проект под названием «Нупедия» . Так как участие в этом проекте было закрытым (не каждый мог добавить статью на сайт и быть редактором других статей) , популярности Нупедия не приобрела и после образования Википедии проект закрыли.

Сергей

wiki - "быстрее" с гавайского
pedia - от англ. Encyclopedia - энциклопедия.

Понятно, что здесь игра слов: Википедия - Энциклопедия, а греч παιδεία имеет очень посредственное к этому отношение.

Как переводиться слово википедия

Название Википедия произошло от слов "вики" и "энциклопедия", а слово вики, в свою очередь, - от гавайского слова "wikiwiki" - "как можно быстрее". Технология Вики, на которой базируется Википедия, родилась уже 10 лет назад как подход к коллективному ведению софтверных проектов, поддержания в должном порядке развития технических заданий и спецификаций. Основная идея вики-технологии состоит в обеспечении возможности коллективной работы с документами.

Дмитрий до

Ви́ки - веб-сайт, структуру и содержимое которого пользователи могут сообща изменять с помощью инструментов, предоставляемых самим сайтом.
Ну а Педия - это взято от слова энциклопедия, которое образовано от др. -греч. παιδεία - обучение

Если раньше для поиска информации постоянно пользовались только печатными энциклопедиями, сейчас дела обстоят по-другому: достаточно подключиться к сети интернет, открыть браузер и загрузить главную страницу «Википедии », которая является своего рода большим справочником.

Глобализация информационного обмена и развитие современных информационных технологий сделали возможным то, о чем могли только мечтать самые смелые фантасты. Новое тысячелетие (официально днем рождения проекта считается 15 января 2001 года) подарило миру настоящий коллективный разум – электронную энциклопедию, в составлении которой может принять участие любой житель планеты, имеющий доступ в сеть интернет. Википедия – это многоязычная энциклопедия, которая пишется и редактируется в режиме реального времени.

В чем же преимущества «Википедии» перед ее аналогами или web-версиями известных мировых энциклопедий? Дело в том, что данный ресурс является мультиязычным, поддержка более 130 языков мира. Нет еще такого ресурса, который объединял усилия стольких народов и наций.
На данный момент Википедия содержит более 16 миллионов определений и статей, написанных на 271 языке мира. Больше половины статей в Википедии написаны по-английски, а русский раздел энциклопедии составляет около 20% общего объема.

Отцами-основателями проекта Википедия считаются американцы Джимми Уэйлс и Ларри Сэнгер, Название «Википедия» является синтетическим, составленным из «энциклопедии» и «вики» - особой технологии создания сайта. На этой технологии сделан не только сайт википедии, но и многие другие, например луркморье. Многие известные понятия и личности вошли в оба проекта, например, мемы, люди вроде Джулиана Ассанжа и президентов, политики.В свою очередь, происхождение приставки «вики» имеет спорную природу: некоторые историки интернета утверждают, что это «гавайский диалект произношения слова Quicky («по-быстрому, на скорую руку»), другие представляют wiki как аббревиатуру выражения “What I Know Is” («А я знаю, что…»).

Для того чтобы внести изменения необходимо нажать «Править», затем вы вводите новые данные и нажимаете кнопку «Сохранить». Все, информация была изменена. Стоит отметить, что любой другой пользователь также может ее изменить. В таком случае рекомендуется дополнять статью, указав, что есть несколько толкований для описываемого предмета или события.

Еще одним большим плюсом этой интернет-энциклопедии является автоматическое появление перекрестных ссылок. Что это такое? Перекрестные ссылки служат для большей информативности. К примеру, вы открыли статью о компьютерной мышке. В тексте статьи вы встретите ссылки на материалы, заголовками которых являются слова синего цвета с характерным для ссылок подчеркиванием. В этой статье можно встретить ссылки на Windows, Apple, x86, браузер и т.д.

Возраст «Википедии» уже более 10 лет, т.к. датой опубликования первой статьи считается 15 января 2001 года. Если вы используете в качестве текстового редактора не MS Word, а программу OpenOffice Writer, у вас есть возможность установить дополнение, которое осуществляет быстрый доступ к информации на страницах «Википедии».

Здравствуйте, уважаемые читатели блога сайт. Наверное, все вы знаете, что такое Wikipedia . Но знаете ли вы, как она устроена изнутри? Кто ее создал и продолжает создавать? Как принять участие в наполнение самой народной из всех энциклопедий?

Все знают, что Википедия — это самая большая в мире энциклопедия , материалы для которой создают не профессиональные редакторы, а все пользователи интернета, которые в соответствующих вопросах. Казалось бы, что такой подход должен привести к полному заспамливанию и ее быстрой кончине, но принципы работы движка Вики позволяют этого избежать.

Кроме того, что эту интернет-энциклопедию просто-напросто интересно читать (аж не оторваться из-за ее всеобъемлющей ), вам никто не мешает поучаствовать в ее наполнении. Например, в русскоязычной части Википедии существует масса тем не освещенных в достаточной мере или не затронутых вообще. Ну, а так как мы с вами все же оптимизаторы, то можно будет попытаться извлечь из этого небольшую выгоду и для своего ресурса (без спама, естественно).

Wikipedia — что это такое и что стоит за ее популярностью

До 2004 года Википедия вся размещалась на одном единственном сервере, сейчас же она расползлась по сотням, а возможно, что уже и тысячам машин. На все это требуются материальные средства, которые черпаются из добровольных пожертвований от частных лиц и крупных организаций (создатель не так давно пожертвовал крупную сумму данному проекту).

Для поддержания работы самой крупной в мире энциклопедии и еще ряда сопутствующих проектов была создана некоммерческая организация ВикиМедиа , которая и решает все организационные и финансовые вопросы.

Вообще, создание народной энциклопедии дело не новое. Первым подобным экспериментом можно считать справочное издание, выпущенное Дени Дидро в середине восемнадцатого века. Оно состояло из трех десятков томов и в ее написании и редактировании принимали участие и сами читатели, которые по почте присылали редакторам свои замечания и суждения по тем или иным вопросам. Ее с некоторой натяжкой можно считать далекой предшественницей Wikipedia.

Что же такое Википедия сегодня? Ее история начинается в 2001 году. Хотя идея создания энциклопедии доступной всем (распространяемой по лицензии GNU GPL) пришла в голову авторам чуть раньше и их первый проект носил название Nupedia. Она должна была по задумке отцов-основателей состоять из жестко выверенных и написанных профессионалами своего дела статей. Но таких профессионалов, желающих поработать бесплатно на благо общества, нашлось не так уж и много.

За время существования Nupedia (с 2000 по 2003 года) было закончено лишь чуть больше семи десятков статей. Безусловно, что продолжая развивать эту идею, а не переключившись на Wikipedia, ее авторы не добились бы такого ошеломляющего успеха. Но что же послужило тем ключом, что позволил этому проекту на данный момент стать самой большой, объемной и самой популярной гаванью знаний в мире?

Да, собственно, случай, благодаря которому авторы решили создать на одном из Вики-движков своеобразный черновик, где эксперты могли бы добавлять и корректировать свои статьи перед добавлением их в Нупедию. Ну, а в 2001 году этот черновик обзавелся собственным доменным именем (читайте про то, и ) Wikipedia.org и стал самостоятельным проектом, где корректировать, править или создавать заново статьи могли вообще все желающие в не зависимости от их образования, ученых степеней, гражданства и прочих атрибутов.

Эта энциклопедия стала настолько популярной и настолько значимой для миллионов пользователей интернета, что про нее был снят довольно познавательный фильм, который вы можете посмотреть с русским переводом. Из него можно будет получить наиболее исчерпывающий ответ на вопрос: Что такое Википедия и чем она так так уж хороша?

В Вики очень трепетно относятся к разглашению личных данных во избежании возможных выяснений отношений в реальной жизни. Править статьи могут даже не зарегистрированные пользователи, что на первый взгляд должно привести к ее жестокому заспамливанию, как, например, на форумах или блогах без соответствующей модерации.

Википедия изнутри — что это и как устроено

Однако, случаи вандализма, которые, конечно же, встречаются, проходят для посетителей этой виртуальной базы знаний практически незаметно. Тут все дело в принципах работы Wikipedia. Она ведет историю всех изменений и откатить страницу к ее довандальному виду не представляет никакого труда.

Сделать это может даже не зарегистрированный пользователь заметивший неладное, ну или специально выделенный для этого человек, у которого этот процесс займет еще меньше времени.

Существование Википедии в ее теперешнем виде прежде всего обязано тому, что портить статьи получается даже более трудозатратно, чем их восстанавливать, да и мало кто успеет заметить внесенные вандалом изменения, что напрочь отбивает у вандала желание продолжать (ведь даже ругаться с ним никто не будет — просто проигнорируют и вернут все взад, что гораздо обиднее и убивает интерес гадить дальше на корню).

Высокая скорость, с которой вандализм удаляется со страниц виртуальной энциклопедии, во многом объясняется активным использованием для этой задачи так называемых ботов (программ).

То же самое касается и спама — проставления ссылок на свой сайт. Как правило, через некоторое время (минуты или часы) этих ссылок там уже не будет, да и в некоторых, особенно популярных у сеошников статьях, правка вообще запрещена (вносить изменения сможет только Администратор или более широкий круг пользователей из категории авторов). Однако, не все так печально.

Если ваша статья (на которую вы проставляете ссылку) действительно покажется полезной и дополняющей изложенный там материал, то она может остаться висеть там очень надолго. Еще выше шанс закрепиться будет у ссылки, которую вы проставите в качестве дополнительного материала к той публикации в Википедии, которую напишите сами.

Будет ли от этого польза? Мне так кажется, что будет, но все не так однозначно. Конечно же, обратные ссылки с Вики , что, по идее, обесценивает их в глазах Яндекса и Гугла. Но поиск, по-моему, сейчас берет в расчет и такие бэклинки, учитывая их каким-то особым образом.

Во-вторых, в каждой языковой группе (государстве) имеется своя эффективная система управления и взаимоотношений. Самый обычный анонимный (не зарегистрировавшийся пользователь ) все равно имеет право создавать и вносить изменения в уже созданные статьи (в качестве автора будет указан IP адрес его компа), но только не в те, на которые наложена частичная блокировка. Такую защиту может накладывать администратор в случае участившихся случаев вандализма.

Зарегистрировавшийся пользователь получает свою личную страничку в Википедии, с течением времени и по ходу проведения им вменяемых правок его возможности несколько расширяются, он сможет вносить изменения в частично заблокированные статьи, а так же загружать файлы в эту виртуальную энциклопедию.

Ну, а если брать выше (администраторы, арбитры, патрулирующие, бюрократы и др.), то получить одну из этих должностей можно только выборным путем, если ваши заслуги перед энциклопедией будут замечены и оценены (данная работа, естественно, не оплачивается).

Если вам интересно, какие функции возложены и какие возможности делегированы этим самым вышестоящим чиновникам от Wikipedia , то имеется довольно краткое, но емкое описание всей этой кухни — категории участников русскоязычной Вики . Кроме живых людей свои личные странички имеют и боты, которые создаются для разгребания рутины. Видимо, так их проще учитывать.

Если вам интересен реальный перечень всех участников русскоязычного сообщества, то вы сможете посмотреть на этой странице , просто выбрав из выпадающего списка «Группа»:

Итак, прежде, чем начать творить, следует с помощью встроенного поиска (его форма расположена в верхнем правом углу) убедиться в том, что такого материала еще не существует в этой энциклопедии. Еще следует пробить и возможные варианты тематики.

Регистрация и создание новой статьи в Wikipedia

Допустим, что данная тематика не была освещена или раскрыта полностью. Таким образом ваша статья придется к месту. Но как ее создать? Оказывается довольно просто. Вбиваете в адресную строку своего браузера следующий УРЛ:

Http://ru.wikipedia.org/wiki/Название статьи

Что такое адресное пространство в Википедии? Оно устроено таким образом, что в Урлах нет названий разделов или категорий, а сразу же после стандартной конструкции http://ru.wikipedia.org/wiki/ следует название статьи, причем на русском языке. Это своеобразная реализация человеко-понятных Урлов .

На самом деле, это не есть здорово при реализации на своем проекте, ибо при копировании такой ссылки из адресной строки Хрома, вы обнаружите чудовищной длины Урл, где вместо русских букв будут странные символы:

Http://ru.wikipedia.org/wiki/%D0%9A%D1%82%D0%BE%D0%9D%D0%B0%D0%9D%D0%BE%D0%B2%D0%B5%D0%BD%D1%8C%D0%BA%D0%BE%D0%B3%D0%BE

Но не суть. Если у вашей статьи может быть несколько альтернативных названий, то можно будет создать их все, но затем сделать перенаправление на основную (фактически 301 редирект), чтобы не множить дубли.

Второй способ создания новой статьи заключается в нахождении публикации родственной тематики и простановке с нее ссылки на вашу, еще не существующую страницу. Wikipedia позволяет это делать и такая ссылка будет подсвечена красным цветом, а не синим, как обычные. Ссылка в Wiki движках создается банально (используются фактически принципы ):

[[название статьи]]

Если захотите создать ее с анкором (текстом ссылки) отличным от названия статьи, то используйте следующую конструкцию:

После этого просто переходите по ней и наблюдаете то же самое окно, что и в случае ввода в адресную строку браузера Урла вида http://ru.wikipedia.org/wiki/Название статьи:

Как видите, кроме информации об отсутствии искомой страницы, вам будет предложено ее скоренько создать, прочитав предварительно гайд по-быстрому освоению премудростей Вики-разметки .

Перейдя по ссылке «создать такую страницу», вы попадете в окно ее редактирования (в данном случае создания), где обозреете краткий курс молодого бойца со сносками на более подробное изложение материала, а еще получите возможность сразу же приступать к творчеству, вводят текст и разметку в предназначенную для этого область имеющегося там редактора:

Для тренировки в создании статей советую воспользоваться своим личным адресным пространством. Для этого нужно будет пройти регистрацию на сайте Википедии (ссылка «Создать учётную запись» в верхнем правом углу экрана):

Имя при регистрации можно вводить и русскими символами, а также вы можете переключиться в безопасный режим работы с сайтом (с шифрованием через протокол https). После заполнения и отправки данных формы регистрации вас сразу же автоматически авторизует на сайте Wiki и отобразится традиционное приветствие:

Получите в свое распоряжение личную страничку с адресом вида:

Http://ru.wikipedia.org/wiki/Участник:Дмитрий_Иванецку

На предыдущем скриншоте на оранжевой полосе написано, что новый пользователь (тобиш я) получил новое сообщение. Перейдя по этой ссылке вы увидите довольно компактный вариант ответов на все вопросы новичков в Wikipedia:

Потратьте минут двадцать на то, чтобы узнать что такое Wiki-разметка, ибо она гораздо более удобна, чем непосредственное оформление текста с помощью Html тегов, однако, все же работа в визуальных редакторах или для начинающих было бы самое то.

Особенности и нюансы создания статей в Википедии

Но и у Wiki-разметки есть свои плюсы по сравнения с визуальными редакторами — все совершаемые в них действия однозначны, в то время как в визуальном редакторе зачастую попадаешь в ситуацию, когда не понятно, как такое получилось и что же теперь делать (приходится лезть в Html код и уже править там на прямую то, что наворотили).

Сами можете быстро пробежаться по основным элементам страниц в Wikipedia , которые собраны в этой таблице . Например, нужен заголовок второго уровня (в исходном коде созданной страницы отобразится в тегах H2) — заключаете его в дважды повторенные знаки равно:

Заголовок второго уровня ==

Нужно начать новый абзац и закончить текущий (аналог тега P) — просто оставьте между ними пустую строку (как в редакторе Вордпресса). А списки? В нужно открывающие и закрывающие теги постоянно прописывать, а в Wiki только звездочку (для ненумерованного списка) или решетку (для нумерованного) нужно проставить перед строкой. Ну, а для вложенных пунктов достаточно увеличить число звездочек или решеток на одну.

Пример вики-разметки для создания списков:

* Первый уровень ** Второй уровень **# Третий уровень с переходом к нумерованному списку

А это Html код, который надо было бы написать:

  • Первый уровень
    • Второй уровень
      1. Третий уровень с переходом к нумерованному списку

Чутка сложнее получается в языке гипертекстовой разметки, чем в редакторе Википедии. А помните , который сохраняет исходное форматирование и все переводит в моноширинный шрифт? Так вот для реализации того же самого, тут достаточно будет просто поставить пробел в начале строки.

Так же в Wikipedia довольно просто реализована вставка как внутренних, так и внешних ссылок (описание смотрите ). Если нужна гиперссылка с анкором совпадающим с адресом (окончанием Урла) страницы, то это делается так:

[[название статьи в Википедии]]

Если же нужно анкор поменять, то достаточно будет просто написать его после вертикальной черты:

[[продвижение сайта|продвижением сайтов]]

Приведенный пример понадобится вам в том случае, когда вы закончите-таки писать свой шедевр для этой энциклопедии и начнете искать другие тематичные статьи, с которых можно было бы проставить ссылку на вашу. Ничего не напоминает? Правильно, это та самая , из-за которой Википедия стоит в Топе практически по каждому информационному запросу.

В руководстве для новичков вам настоятельно порекомендуют ссылаться из своей статьи на другие , которые могут служить пояснением сложных терминов или выражений, а также предписывают после публикации сразу же пойти и проставить ссылки с других уже существующих страниц Wiki, чтобы ваше новое творение не стояло сиротливо в сторонке от общей, насквозь прошитой многочисленными внутренними ссылками, массы статей.

Однако, ссылка должна включать в себя название вашей новой статьи без изменения его словоформы. Вот здесь вам и понадобится прописывание анкора, чтобы не изменять текст уже существующей статьи, а просто повесить гиперссылку на уже имеющуюся в ее тексте фразу, написав ее после вертикальной черты.

Внешние ссылки в Wikipedia не принято проставлять непосредственно из текста (учтите это, ибо по любому не прокатит) — для этого нужно использовать либо примечания-сноски (читайте как создаются сноски и оформляются примечания), либо добавлять их в специальный подраздел «Ссылки». Выбор конкретного варианта зависит от того, носит ли эта внешняя ссылка общий характер или же она непосредственно поясняет конкретное место в статье.

Самое простое ее оформление выглядит так:

Https://сайт

После загрузки изображения на Викисклад вам предложат скопировать код вставки этого изображения во все проекты Википедии или получить Урл этой картинки:

Предложенный код будет выглядеть примерно так, но вы вольные его изменять по своему усмотрению:

[]

Вместо «Add caption here» добавьте свою пояснительную надпись:

Можно вставлять миниатюры заданных размеров, можно заключать изображения в рамку и добавлять пояснительные надписи, можно картинки выравнивать по центру, левому или правому краю страницы, а также задавать их обтекание текстом. Если вам интересно, как это сделать при верстке сайта, то читайте про тег или о том, .

На страницу в Wikipedia можно вставлять и таблицы, если это потребуются. Оформляются они опять же гораздо проще, чем в Html, но все равно есть над чем поломать голову. Так что использовать таблицы стоит лишь при необходимости, а не для красоты ().

Если вы создадите в своей статье более четырех подзаголовков, то вверху статьи будет автоматически сформировано оглавление . Его можно переместить или удалить при помощи соответствующих тегов. После создания статьи рекомендую нажать на кнопку «Викификатор», которая проверит валидность вашего кода и если потребуется, то внесет необходимые изменения для приведения его к стандарту.

Так же очень удобно посмотреть в раскрывающемся списке «Справка» как оформляется тот или иной элемент разметки, если подзабыли. Перед сохранением документа лучше будет сначала воспользоваться «Предварительным просмотром», а для получения уведомлений о вносимых другими пользователями Википедии правок в ваше творение, поставьте галочку в поле «В список наблюдения»:

Ну, собственно, все. Теперь вы с уверенностью сможете ответить на вопрос — что же такое Википедия и с чем ее едят.

Удачи вам! До скорых встреч на страницах блога сайт

Привлечение трафика посетителей на свой сайт методами SMO (форумы, социальные сети, группы Subscribe)

Википедия (ссылка) – это крупнейшая онлайн-энциклопедия в интернете. Статьи для нее может написать абсолютно любой пользователь Сети.

Википедия появилась благодаря коллективной работе энциклопедистов-любителей и на сегодняшний день содержит более трех миллионов статей . Статьи эти пишутся более чем на 130 языках мира, среди которых даже латынь и эсперанто.

Википедия — это общедоступная и свободно распространяемая энциклопедия. Первый вариант сайта Википедии начал работать 15-го января 2001 года. Именно это день считается днем рождения Википедии.

Wiki

Данная интернет-энциклопедия основывается на технологии «wiki», создателем которой является Ховард Кэннингем (в переводе с гавайского «wiki» означает «быстро»).

Это программное обеспечение встраивается web-сайта. Технология «wiki» разрабатывалась для записи и структурирования информации. С ее помощью одновременно может работать большое количество пользователей.

Можно писать собственные статьи или исправлять чужие. Огромное преимущество Википедии в том, что написав статью, вам не нужно отсылать ее редакторам. Вы пишите статью (или исправляете чужую, нажав кнопку «исправить») и жмете на кнопку «Сохранить». Проделанные пользователем изменения сразу же будут видны остальным посетителям сайта.

Как это работает?

Чтобы создавать или править статьи, даже не нужно проходить процедуру регистрации. Но здесь есть и свои минусы. Среди пользователе этой интернет-энциклопедии очень много так называемых «вандалов» . Эти люди по каким-то своим соображениям вносят неправильные сведения в чужие статьи.

Например, меняют даты, уродуют фотографии и рисунки. Хорошо, что все варианты сделанных правок сохраняются, благодаря чему путем сравнений можно отбросить очевидную ложь.

В Википедии пропагандируется принцип «нейтральности» . То есть автор должен описать в статье все спорные мнения по выбранной тематике. Другой принцип – «опираемся на источники» (благодаря ссылкам на источники можно провести общую проверку предложенных фактов). Хотя присутствует в Википедии очень много статей, переполненных субъективизмом или неправильно описывающих то или иное событие.

Владельцем Википедии является компания Wikipedia Foundation Inc, курирующая и некоторые смежные проекты: сайт новостей («Викиновости»), словарь («Викисловарь»), набор учебных текстов («Викиучебник»), библиотека («Викитека»), цитатник («Викицитатник»), коллекция медиа-файлов («Викисклад»).

Содержимое с этих ресурсов вы можете использовать как для получения конкретной информации, так и для написания статьи для Википедии.

Часто мы слышим высказывания об уникальности этого проекта. Но ведь идея эта отнюдь не нова. Например, еще за три года до запуска Википедии в 1998 году был разработан сайт Everything, позже модифицированный в Everything 2.

В рамках проекта осуществлялся сбор информации по всем областям знаний на основе очень схоже с «wiki» технологии.

Уникальность Википедии заключается лишь в массовости участвующих в проекте пользователей. Википедия уже давно превзошла по популярности и «Большую Советскую Энциклопедию» и «Британку». Недавно Википедия вышла за рамки только web-страниц – пользователи OpenOffice получили доступ к базам данных этой интернет-энциклопедии.

Для этого необходимо зайти на сайт Лорана Годара (французский программист) и бесплатно скачать OooWikipedia размером менее 70 Кб. Данный плагин является макросом для всех приложений OpenOffice.

Надеемся, что благодаря этой статье, вы теперь имеете представление о том, что такое википедия и «с чем ее едят».

Возможно, вам будет интересно:

Люди, мало знакомые с интернетом, вряд ли знают, что такое ЖЖ. Специально для таких «новичков» мы подробно разберем это, на первый взгляд, странное сокращение. На самом деле, все довольно просто. Аббревиатура ЖЖ расшифровывается как Живой Журнал. Это аналог англоязычного сайта livejournal.com (русская версия - lj.ru), где каждый пользователь может завести личный онлайн-дневник, блог и выставлять на суд общественности свои мысли и чувства. Здесь пишут на…

В наши дни, наверное, не осталось тех, кто бы не знал, что такое интернет. Ну, разве что, какие-нибудь дикари из африканских племен. Интернет – это огромная сеть компьютерных ресурсов, обладающая коллективным доступом на базе унифицированного способа адресации, высокопроизводительных магистралей и высокоскоростной связи с хост-компьютерами. Другими словами, интернет представляет собой сеть из миллиардов компьютеров. Кабели для передачи информации прокладывают по дну океанов, соединяя континенты, и подключая…

Смартфон – это мобильный телефон, на котором установлена довольно мощная операционная система. В этой ОС пользователи могут самостоятельно инсталлировать приложения, работать сразу с 2-мя программами, словом, делать все то же самое, что и на обычном компьютере, только в меньшем объеме. Надежная операционная система – визитная карточка любого смартфона. Сегодня можно встретить такие ОС для смартфонов как Windows, Google Android, Apple iOS, Plm OS, Simbian и…

На данный момент, в крупнейшей социальной сети СНГ зарегистрировано около 150.000.000 (150 миллионов) человек. Это совершенно разные люди в плане возраста, интересов, и так называемой компьютерной грамотности. Да-да, многие из них даже и не догадываются, что такое ID вконтакте и для чего он нужен. Раз уж вы попали на страницу этой статьи - значит и вас можно отнести к этой категории. В этом незнании нет ничего плохого.…

Мультиязычная интернет-энциклопедия, построенная на принципах Вики. Название ее складывается из английских слов wiki (слово заимствовано из гавайского языка и имеет значение «быстро») и encyclopedia (энциклопедия). По сути, – это вебсайт, содержимое и структуру которого могут сообща изменять сами пользователи с помощью инструментов, предоставляемых этим же сайтом.


Обычные книжные энциклопедии обновляются раз в год или реже, в то время как могут редактироваться множество раз в течение 1 часа.

Прародителем Википедии считается Нупедия, которая реализовывала принципы свободы информации. Нупедия – это английский -проект, и авторами страниц были люди из среды и различные ученые. Чтобы ускорить развитие проекта, основатели Нупедии – главный редактор Лоуренс Сэнгер и финансовый директор Джимми Уэйлс - в январе 2001 года открыли сайт «Википедия».

Новый сайт, реализованный на технологии вики-страниц, позволял принимать участие в написании и редактировании информации любому пользователю Всемирной сети. В мае уже были каталанский, эсперанто, иврит и японский языковые разделы Википедии. Позже появились венгерский и арабский разделы. Основное достоинство Википедии – возможность предоставления информации на родном языке, что сохраняет ее ценность в моменте культурной принадлежности.

В частности, читатель может информацию так и дополнить ее по любой теме и по любому слову, имеющему несколько значений. К примеру, страница Википедии по слову «профурсетка» предлагает пользователям помочь проекту, исправив, дополнив и уточнив сведения о произношении, семантике и этимологии слова.

Сущность Википедии

В настоящее время в Википедии уже 276 языковых разделов и 30 миллионов статей. Сам сайт стоит на пятом месте по . Это самый крупный справочник в интернете и самая полная энциклопедия за всю историю человечества.


По состоянию на 12 апреля 2014 года в Википедии (русская версия) насчитывается 1 104 764 статей самой разнообразной тематики.

Википедия – главный объект внимания СМИ как источник самых последних новостей в виду того, что информация на страницах сайта постоянно обновляется. Для новостных репортажей создан родственный проект Викиновости.

В Википедии отражается информация, которая установлена и уже признана. Иными словами, это не площадка для размещения чьих-то собственных исследований, идей, изобретений, теорий или оценок. Тема считается энциклопедической, т.е. значимой, если она уже имеет значительное освещение в авторитетных источниках. Это могут быть серьезные научные журналы или СМИ, которые независимы от предмета темы.

Иерархия

Участники проекта Википедия образуют сообщество участников «Википедии», которое имеет иерархическую структуру. Участники с хорошей репутацией сообщества имеют возможность баллотироваться на какой-либо уровень добровольного руководства. Существуют автоподтвержденные, патрулирующие, переименовывающие и подводящие итоги участники. Самая большая группа привилегированных пользователей - администраторы, которые могут удалять или блокировать страницы в случае вандализма. Права расширяются с присвоением статуса бюрократа, ревизора, проверяющего и арбитра. Высшая ступень – клерк, который регулирует работу арбитражного комитета.