каталог штрих кодов товаров база данных
База данных штрихкодов скачать бесплатно без регистрации (и прочей хурмы)
Добрый день. В открытом доступе наконец-то появился огромный справочник штрихкодов с наименованиями товаров, категориями и брендами.
Мы работаем над ним лет 8 и теперь в нем около 3 миллионов штрихкодов в стандартах EAN (EAN-13, EAN-8) и UPC (UPC-A, UPC-E).
Что там?
Там таблица, содержащая записи штрихкодов и соответствующие им наименования товаров, во всех записях есть категория и во многих — бренд.
Спектр представленных товаров очень широкий. Тяжелой техники там нет, но потребительские сегменты присутствуют, вероятно, все (фармацевтика, парфюмерия, косметика, продукты питания, игрушки, sexshop-ассортимент, книги, канцелярия, метизы, инструменты и т.д. и т.п.)
Оригинальная он-лайновая версия справочника хранится на сервере Universe-HTT.
Открытая версия размещена на github’е. Обратите внимание на то, что в исходниках хранится фрагментированная база данных. Полный файл находится в релизе.
Зачем он нужен?
Те, кто искал (чаще всего безуспешно) в интернете или где-либо еще справочник штрихкодов и так знает зачем он нужен. Для остальных перечислю полезные свойства такого обширного массива данных:
Формат представления
База данных представлена текстовым файлом в кодировке UTF-8 с полями, разделенными символом табуляции.
Структура записи следующая:
Записи в свободно распространяемом формате отсортированы по наименованию товара в алфавитном порядке.
Особенности
Если вы внимательно изучите представленные данные, то заметите, что в отличии от большинства, имеющихся в интернете аналогичных справочников (и платных и бесплатных), над наименованиями товаров была проведена интенсивная работа.
Пара слов о том, как мы это делаем.
Прежде всего, справочник (администрируемый в системе OpenPapyrus) подвергается автоматическому процессингу с помощью технологии, которую я как-то описывал на Хабре.
Хотел бы сказать, что упомянутая технология все за нас делает. Но, увы. Большой объем работы приходится делать в полу-автоматическом и ручном режимах.
Многие наименования приходится «дешифровывать» — в первоисточнике они могут содержать немыслимые сокращения и полностью пренебрегают нашей системой именования товаров 🙂
Все штрихкоды, опубликованные в открытом доступе, гарантированно прошли проверку на соответствие одному из 4-х стандартов: EAN-13, EAN-8, UPC-A, UPC-E и включают контрольную цифру. Возможные дефекты и проблемы опишу ниже.
Полнота и актуальность
На типичный вопрос «все ли штрихкоды есть в справочнике?» ответ стереотипен: нет и быть не может.
Если оценивать полноту справочника по вероятности отсутствия там штрихкода, который случайно попался вам на глаза, то это будет процентов 10-15 (очень грубая моя собственная оценка, к тому же, сами понимает, предвзятая). В любом случае, ничего похожего по размеру в открытом доступе больше нет
Географический охват (по странам, в которых товары продаются) значителен: Россия, Украина, Беларусь, США, Великобритания, Европейский Союз, ЮАР, Бразилия, Малайзия и многие иные.
Языки представления главным образом русский и английский. Источники с остальными языками мы обычно игнорируем, поскольку ничего в тех языках не смыслим (в виде исключения встречаются позиции на испанском, чешском, и прочих языках).
Мы обновляем справочник на сервере Universe-HTT с периодичностью в несколько месяцев (когда накапливаем в предварительном буфере достаточный объем данных). Последний раз заливали данные в июне этого года. Совсем новые позиции там скорее всего отсутствуют. Однако, хотя это и покажется удивительным, новые штрихкоды появляются не так уж часто. Многие товары с одними и теми же кодами продаются в ритейле годами.
Открытую версию справочника так же планируем время от времени обновлять.
Источники
Из каких источников все эти данные мы берем? В основном, из интернета. Собираем различные прайс-листы, открытые отчеты, в том числе государственных органов (например, некоторые штаты в США публикуют данные о закупках).
Косяки
Справочник содержит ряд дефектов. Их не много, но сообщить о них необходимо.
Дефективные коды
В первую очередь, попадаются штрихкоды, которые по ошибке трактуются как UPC-A в то время как на самом деле это — EAN-13 без контрольной цифры. Причина в том, что первоначальный источник (мы уже не знаем какой) содержал код EAN-13 без контрольной цифры, но последняя цифра удовлетворяла правилу расчета контрольной цифры для UPC-A и наш скромный алгоритм посчитал этот код за относящийся к UPC-A. Это можно было бы поправить, но заметили слишком поздно и руки не дошли до массовой корректировки.
Проблем такого рода исчезающе мало, но, как говорится, увы.
Грубое несоответствие
Далее, есть путаница в товарах. То есть, в некоторых (крайне редких случаях) штрихкоду соответствует наименование, совсем к нему не относящееся.
Приватные коды
Некоторые штрихкоды могут быть приватными. Те EAN-13, которые начинаются на 2 мы отбрасываем на старте, но иногда что-то идет не так и попадаются приватные коды, либо начинающиеся на ‘2’, либо те, что начинаются с какой-то иной цифры, являясь тем не менее частными, не зарегистрированными ни в какой из организаций, занимающихся этим (GS1, например).
Классификация
Как мы не старались наладить хорошую классификацию справочника — удалось не много. Треть позиций принадлежит группе default — то есть абсолютно не классифицирована. Остальные вполне могут иметь ошибочную принадлежность категориям.
Далеко не все товары ассоциированы с брендами, хотя мы и очень трудились над этим вопросом.
Как помочь?
Если у вас есть желание помочь в расширении справочника, то мы будем благодарны за присланные данные об известных вам штрихкодах. Я сильно сомневаюсь, что найдутся желающие, но на всякий случай сообщаю, что по информации в профиле найти меня не сложно.
Тот, кто имеет возможность реализовать автоматическую классификацию элементов справочника и поделится идеями и наработками, получит титул невероятно любезного человека. Мы же со своей стороны обязуемся информировать общественность об успехах собственных изысканий в этой области.
Корысть
Если вам понравился справочник, то отметьте его на github’е звездочкой. Если он вам очень понравился — отметьте звездочкой еще и проект OpenPapyrus, ибо все администрирование и управление справочником осуществляется с его помощью.
Условия использования
Нет никаких. Как хотите, так и используйте. Если дадите ссылку на нас — спасибо, нет — переживем.
Горькие сожаления
Каталог штрих кодов товаров база данных
Сегодня, во время развития мобильных технологий и высокой конкуренции, перед внедренцами и владельцами бизнеса в сфере HoReCa и Retail стоит задача качественной автоматизации объектов в минимальные сроки и по минимальной цене.
При этом значительная часть времени затрачивается на ввод базы данных в Back-office. А ведь с каждым годом на рынок выходит все больше новых продуктов, соответственно увеличивается и количество используемых штрих-кодов.
Возможно ли ускорить этот процесс?
Компания Microinvest разработала удобное решение этого вопроса. Сайт Barcode-list.ru – это специализированный «банк» штрих-кодов и наименований товаров, используемых в России. Наша база уже содержит более 500 000 уникальных штрих-кодов и это количество планомерно растет.
С помощью Barcode-list.ru Вы можете быстро и качественно проверить все необходимые штрих-коды и названия товаров, ввести их в программу и подготовить свой магазин к открытию раньше запланированных сроков.
Как расширяется база данных Barcode-list.ru?
База штрих-кодов и наименований продуктов регулярно расширяется. Дополнения происходят автоматически на основе анализа номенклатур, используемых всеми нашими партнерами и клиентами в Microinvest Склад Pro.
В продукт Microinvest Склад Pro эта база данных встроена, и после считывания штрих-кода «правильное» наименование продукта автоматически выводится системой. Пользователю остается сохранить его или ввести свой вариант.
При работе с другими Back-офисами проверку штрих-кода и наименования необходимо проводить вручную с помощью данного сайта.