
Perplexity дает Apple новый повод отказаться от покупки ИИ-компании"
Perplexity продолжают обвинять в обходе мер защиты от скрапинга веб-контента Компанию Perplexity уже давно обвиняют в намеренном игнорировании мер против скрапинга для сбора веб-контента.
Хотя ранее компания отвергала эти обвинения, называя их недобросовестными или недопониманием, новый отчет свидетельствует, что практика не только продолжается, но и, возможно, усугубляется.
Проблема с методами сканирования Perplexity впервые привлекла внимание в июне 2024 года, когда Wired и другие СМИ обвинили компанию в игнорировании протокола Robots Exclusion Protocol (robots.txt) и извлечении контента с их сайтов.
Тогда генеральный директор Perplexity Аравинд Шринивас заявил, что виновником был неназванный сторонний поставщик услуг веб-скрапинга, а сама ситуация возникла из-за «фундаментального непонимания принципов работы».
Вскоре другие издания также начали обвинять Perplexity в плагиате и неэтичном сборе данных, а The New York Times и BBC даже пригрозили судебными исками.
В ответ Perplexity назвала действия BBC «манипулятивными и оппортунистическими», заявив, что у медиакомпании «глубокое непонимание технологий, интернета и законов об интеллектуальной собственности».
С тех пор Perplexity неоднократно отрицала подобные обвинения, оспаривая определения скрапинга и сканирования в конкретных случаях.
Как сообщал Wired, Шринивас также обещал, что компания упростит доступ к первоисточникам.
Однако сегодня Cloudflare опубликовал отчет, в котором утверждается, что даже когда сервер явно запрещает автоматизированный доступ и включает специальные правила для блокировки сканирования публичными краулерами Perplexity, компания всё равно продолжает это делать.
В заявлении для The Verge Perplexity назвала публикацию Cloudflare «пиар-ходом» и заявила, что в отчете «много недопонимания».
Справедливости ради стоит отметить, что обвинения в недобросовестном сборе веб-контента для использования в ответах ИИ — не исключительная проблема Perplexity.
Ранее методы сканирования OpenAI сравнивали с DDoS-атаками, то же самое касается и Anthropic.
Также важно помнить, что Robots Exclusion Protocol — это не закон, а всего лишь общепринятый стандарт.
Стоит ли Apple покупать Perplexity?** Абсолютно ничто не мешает Apple приобрести Perplexity.
Более того, сейчас кажется более вероятным, что такая сделка состоится, чем нет.
Если честно, я почти ожидаю, что анонс появится до того, как я закончу эту статью.
И Apple действительно стоит купить такую компанию, как Perplexity.
Но учитывая приверженность Apple вопросам приватности и этики, стоит ли ей приобретать компанию с такой спорной репутацией и, откровенно говоря, подходом?
Вполне возможно, что Apple считает: под ее руководством, в рамках ее культуры и этичных практик сканирования веба, она сможет очистить приобретенную технологию от прошлых «грехов».
Однако это не отменяет того факта, что Perplexity добилась своих успехов именно благодаря тем методам, в которых ее обвиняют.