Техники поиска изображений, которые вы должны знать

Откройте прямо сейчас любое приложение для социальных сетей и посчитайте, сколько секунд пройдет, прежде чем вы столкнетесь с блоком простого текста без изображения. Уверен, ждать придется долго! 

Интернет в подавляющем большинстве случаев является визуальной средой. 

По оценкам 14 миллиардов изображений ежедневно распространяются в социальных сетях. В настоящее время Google Image Search индексирует примерно 136 миллиардов изображений, По мнению экспертов, при сохранении нынешних темпов создания изображений к 2030 году их число может достичь 382 миллиардов.

Среди всех этих изображений найти по-настоящему полезное, правильно лицензированное, то, которое действительно показывает то, на что претендует, - очень непростая задача.

В этой статье вы узнаете:

  • Что такое поиск изображений и его различные виды
  • Практическое руководство по эффективному использованию передовых методов поиска изображений
  • Как защитить себя от поддельных изображений в Интернете

Основные выводы

  • Полезные результаты поиска изображений зависят от того, насколько конкретны ваши ключевые слова, на какой платформе вы проводите поиск и какие фильтры вы используете для разрешения и прав на использование.

  • Обычный человек сталкивается с большим количеством дезинформации в своих социальных сетях, поэтому обратный поиск изображений является недостаточно используемым инструментом.

  • Вы можете найти бесплатные высококачественные изображения по лицензиям Creative Commons, Openverse, в коллекциях общественного достояния Смитсоновского музея, музея Метрополитен, Библиотеки Конгресса и т. д.

  • Детектор изображений, не обнаруживающий ИИ, в сочетании с обратным поиском и проверкой метаданных обеспечивает надежную проверку изображений, сгенерированных ИИ. 


Что такое техника поиска изображений?

Техника поиска изображений - это любой метод, позволяющий компьютерной системе находить и извлекать информацию на основе визуального контента. 

Когда в начале 1990-х годов исследователи впервые начали изучать методы поиска изображений, их подход был до смешного прост по сегодняшним меркам. 

Кристел Фалутсос и его коллеги из IBM стали основателями Запрос по содержимому изображения в 1994 году.

Обнаружение искусственного интеллекта Обнаружение искусственного интеллекта

Никогда больше не беспокойтесь о том, что ИИ обнаружит ваши сообщения. Undetectable AI Мы можем помочь вам:

  • Сделайте так, чтобы ваши записи с помощью искусственного интеллекта появились человекоподобный.
  • Байпас все основные инструменты обнаружения ИИ одним щелчком мыши.
  • Используйте AI безопасно и уверенно в школе и на работе.
Попробуй бесплатно

QBIC может искать в базах данных изображений по цвету, текстуре и форме. Красный круглый объект мог соответствовать другим красным круглым объектам. Вот, собственно, и все.

В настоящее время поиск изображений включает в себя удивительно широкий спектр подходов: 

  1. Текстовый поиск изображений, при котором вы вводите ключевые слова и получаете изображения, помеченные соответствующими метаданными. По сути, это то, с чего начинался Google Images.
  1. Поиск изображений на основе содержимого, или CBIR, который анализирует визуальное содержимое.
  1. Обратный поиск изображений, при котором вы предоставляете изображение в Google Lens и TinEye и просите систему найти визуально похожие.

Эффективное использование обратного поиска изображений

Основной механизм обратного поиска изображений довольно прост.

Все, что вам нужно сделать, это предоставить системе изображение, либо загрузив файл, либо, как в случае с Google Lens, буквально направив камеру своего телефона на что-то в физическом мире.

Он проанализирует визуальный контент и вернет вам результаты, которые визуально похожи или контекстуально связаны с вашим изображением. 

Но как заставить эти методы поиска сходства изображений работать лучше? 

Google Lens - это, пожалуй, самый полезный инструмент для потребительских товаров, достопримечательностей и всего, что может иметь значительное присутствие в Интернете. 

Вот результат работы Google Lens, когда мы предоставили ему изображение здания Гарвардского университета:

Техники поиска изображений, которые вы должны знать Техники поиска изображений

TinEye был специально создан для отслеживания происхождения изображений. Он индексирует изображения с 2008 года и по последним подсчетам накопил в своей базе данных более 62 миллиардов изображений. 

Yandex Images лучше всего работает с распознаванием лиц и с изображениями, которые более распространены в неанглоязычных веб-пространствах, в частности, в Восточной Европе. 

A Исследование кибербезопасности 2022 года Мы провели тщательное сравнение этих платформ и выяснили, что точность обратного поиска изображений у них одинаковая: 

  • Google: 65%
  • Bing: 55%
  • Яндекс: 50%

Во многих случаях на интересующем вас изображении будет много визуального шума. Например, оживленный фон, множество объектов, люди, стоящие вокруг объекта, на котором вы хотите сосредоточиться в процессе поиска. 

Поэтому не забудьте привязаться к конкретной теме, которую вы хотите исследовать, чтобы система тоже не запуталась.

Советы по поиску высококачественных изображений

Несколько продуманных изменений в способах поиска и фильтрации могут дать вам гораздо более качественные изображения, чем обычный поиск. 

  • Используйте четкие ключевые слова для поиска

Конкретность поисковых запросов напрямую влияет на результаты, которые вы получите. 

Поисковые системы сопоставляют изображения с запросами в основном благодаря связанным метаданным и окружающему тексту. Исследование поиска изображений по ключевым словам показали, что явные и точные запросы по ключевым словам дают более релевантные результаты. 

Попробуйте представить себе изображение в виде слоев. Начните с объекта съемки, а затем добавьте описания стиля, обстановки, настроения, освещения и предполагаемого использования. 

Кроме того, институциональные архивы, такие как музеи или университеты, а также специализированные платформы стоковых фотографий позволят вам найти изображения иного рода, чем при общем поиске в Интернете. 

Если вам нужна историческая фотография, Google Images, вероятно, не лучший инструмент для ее получения. Библиотека Конгресса, Europeana или коллекции Смитсоновского института, находящиеся в открытом доступе, с гораздо большей вероятностью дадут вам то, что нужно.

  • Фильтр по разрешению изображения

Разрешение, проще говоря, - это размер изображения. Может случиться так, что изображение прекрасно выглядит в размере миниатюры, но при печати превращается в пиксельную кашу. 

Почти во всех инструментах поиска изображений можно отфильтровать интересующие вас изображения по размеру с помощью встроенных функций поиска. Расширенный поиск Google Images, например, позволяет фильтровать результаты по размеру, формату, правам использования и многим другим параметрам. 

В Google Images эти фильтры можно найти в разделе “Инструменты” после того, как вы выполнили первичный поиск. Или просто нажмите здесь чтобы опробовать его.

Техники поиска изображений, которые вы должны знать Техники поиска изображений

Поисковые платформы для изображений, такие как Unsplash, Pexels и Adobe Stock, построены на высоком разрешении в качестве базового уровня. Вы вряд ли найдете там что-то ниже порога пригодности.

Необходимое вам разрешение во многом зависит от того, для каких целей вы используете изображение. 

  • 72 DPI, или все, что больше 1000 пикселей, является стандартным разрешением для использования в Интернете.
  • Для печати полностраничного изображения требуется разрешение не менее 300 DPI, или 2500 x 3500 пикселей.

Формат JPEG в большинстве случаев подходит. Если вам нужно изображение с прозрачным фоном, PNG или TIFF сохранят больше данных.

  • Проверьте авторские права или права на использование

Найти изображение и уметь его использовать - совершенно разные вещи. 

Согласно Данные отслеживания DMCA, На изображения приходится 23% всех запросов о снятии авторских прав, что является самой большой категорией индивидуально направленного типа контента в Интернете. 

Самое надежное место для получения пригодных для использования изображений - это места, где права на использование четко прописаны с самого начала. 

Лицензирование Creative Commons существует в диапазоне от “свободно для любого использования” до “требуется указание авторства” и “только для некоммерческого использования”.”

Сайт Инструмент поиска Creative Commons, который теперь называется Openverse, Позволяет фильтровать поиск по типу лицензии. Вы сможете найти изображения, соответствующие вашим потребностям, не заботясь о разрешениях. 

Многие коллекции изображений, являющихся общественным достоянием, из институциональных архивов широко доступны и бесплатны для использования.

В Метрополитен-музее есть более 490 000 изображений высокого разрешения в своей коллекции, являющейся общественным достоянием, и все они доступны для скачивания и повторного использования без ограничений. 

Более того, расширенный поиск Google Images также позволяет фильтровать изображения на основе “прав использования”.”

Как необнаруживаемый искусственный интеллект улучшает поиск изображений

Разрыв между тем, что люди хотят найти, и тем, что они на самом деле ищут, уже давно является признанной проблемой в информационном поиске. 

Большинство пользователей не знают, как составлять конкретные поисковые запросы. Вы можете использовать чат Undetectable AI, чтобы помочь вам найти правильные ключевые слова, описывающие изображения, которые вы задумали, прежде чем обратиться к инструменту поиска изображений. 

Еще одна проблема, с которой мы сталкиваемся при работе с изображениями, - это вопрос о том, реальны они или нет. Масштабное исследование Опубликовано на сайте arXiv проанализировали около 287 000 оценок изображений, полученных от более чем 12 500 участников по всему миру.

Оказалось, что при попытке отличить сгенерированные ИИ изображения от реальных люди добиваются успеха лишь на 62%.

Детектор необнаруживаемых изображений ИИ проводит анализ на уровне пикселей для поиска текстуры, шума, насыщенности цвета и структурных артефактов, статистически связанных с генеративным ИИ. 

Обнаружение основано на содержании пикселей, а не на метаданных. Поэтому, если метаданные изображения были удалены, а водяной знак отсутствует, вы все равно сможете определить его AI происхождение.

Он совместим со всеми следующими генераторами изображений: 

  • DALL-E
  • Стабильная диффузия
  • Середина путешествия
  • Идеограмма
  • Флюс
  • Bing Image Creator
  • GANs
  • Нанобанан (Google DeepMind)
  • Seedream
  • Adobe Firefly

Избегайте поддельных изображений в Интернете

По оценкам, более 500 000 deepfakes были распространены на социальные сети только в 2023 году. И это только синтетические сорта.

Он не учитывает гораздо больший объем реальных фотографий, намеренно вырванных из контекста или переработанных из старых событий, чтобы исказить текущие. 

По данным NewsGuard, которая отслеживает источники дезинформации, количество сайтов фальшивых новостей, управляемых искусственным интеллектом, увеличилось в 10 раз в 2023 году и продолжает расти с 2026 года.

Когда люди ищут изображения, связанные с последними новостями, эти поддельные, манипулированные изображения часто оказываются в числе наиболее распространенных, а значит, и наиболее индексируемых.

Поэтому, когда вам попадается изображение, вызывающее бурную реакцию, всегда проводите обратный поиск, чтобы узнать, когда оно было впервые использовано, в каком контексте, каков источник фотографии и заслуживает ли он доверия. 

У нас также есть полезное руководство по как определить, является ли изображение сгенерированным искусственным интеллектом или подделкой.

Когда изображение редактируется и пересохраняется, обработанные участки сжимаются иначе, чем исходные. Это можно обнаружить с помощью метода анализа уровня ошибок (ELA), используя бесплатный веб-инструмент, FotoForensics.

Практическое использование поиска изображений

Поиск изображений имеет гораздо больше применений, чем вы можете себе представить. Вот некоторые из практических применений поиска изображений:

  • Если вы увидели куртку, которую хотите, но понятия не имеете, как она называется или кто ее производит, загрузить фотографию - бесконечно более прямой путь, чем пытаться описать ее ключевыми словами. Пользователи визуального поиска конвертируются на 30% больше, чем пользователи традиционного текстового поиска в интернет-магазинах. 
  • В здравоохранении системы поиска медицинских изображений на основе контента помогают врачам искать в базах данных по радиологии и патологии визуально похожие случаи. 
  • Вся карьера журналистов строится на проверке фактов. Глобальная сеть журналистских расследований формализовала поиск изображений как ключевой инструмент проверки в журналистике. Он используется для отслеживания происхождения фотографий, идентификации людей на изображениях, определения первоначального контекста сцены, перекрестного сопоставления визуальных доказательств из нескольких источников и т. д.
Скриншот детектора изображений искусственного интеллекта
  • Компания Google разработала SpeciesNet - модель искусственного интеллекта с открытым исходным кодом, используемую для идентификации диких животных на изображениях, полученных с помощью фотоловушек. Она помогает в работе по сохранению дикой природы, автоматизируя идентификацию видов по изображениям. 

Улучшите свою работу с помощью нашего детектора искусственного интеллекта и гуманизатора - начните с этого!

Заключительные мысли

Инструменты для поиска изображений есть в каждом телефоне. Один только Google Lens сейчас обрабатывает 20 миллиардов поисковых запросов в месяц, за относительно короткий срок увеличившись с 10 миллионов ежедневных использований. 

Методы расширенного и обратного поиска изображений, описанные в этой статье, должны помочь вам извлечь пользу из имеющихся в ваших руках инструментов.

Кроме того, умение отличать сгенерированное искусственным интеллектом изображение от действительно созданного человеком - это базовый навык грамотности для каждого, особенно когда мы живем в мире, где доминирует искусственный интеллект. 

Наш сайт Необнаруживаемый ИИ Анализирует шумы, артефакты сжатия, насыщенность цвета и сигналы в частотной области, чтобы помочь вам избежать поддельных изображений в Интернете.

Попробуйте уже сегодня!