...

Как автоматизировать анализ контента сайта с помощью n8n и Google Sheets

В современном мире информации слишком много, и вручную собирать, анализировать и структурировать данные с веб-сайтов — задача, которая отнимает массу времени. Благодаря n8n вы можете полностью автоматизировать этот процесс, используя искусственный интеллект (chatGPT) для извлечения полезной информации и сразу же сохранять её в Google Sheets.

В этом руководстве мы разберём пошаговую настройку workflow, который:

  • загружает HTML-контент страницы;
  • преобразует его в удобный для ИИ формат (Markdown);
  • анализирует и извлекает ключевые данные с помощью chatGPT;
  • сохраняет структурированные результаты в Google Sheets;
  • работает без необходимости писать код.

Подходит для маркетологов, аналитиков, исследователей, студентов и всех, кто хочет экономить время на ручной обработке информации.

Ранее на нашем сайте мы рассказывали, Как установить n8n Community Edition на VPS — если у вас ещё нет рабочего экземпляра n8n, начните с этого руководства.

Основная часть

1. Общая логика работы

Workflow состоит из 5 ключевых этапов:

  1. Ввод данных — вручную запускаем процесс и указываем ссылку на сайт.
  2. Преобразование — HTML преобразуется в Markdown для лучшего анализа ИИ.
  3. Анализ — chatGPT формирует краткое резюме и выделяет ключевые элементы страницы.
  4. Сохранение — результаты записываются в Google Sheets.
  5. Документация — встроенная заметка с инструкциями.

2. Пошаговая настройка workflow в n8n

Шаг 1. Создаём триггер

  • Добавьте Manual Trigger (узел «Click to Start»).
  • Этот узел запускает workflow вручную.

Шаг 2. Получаем HTML-код сайта

  • Добавьте HTTP Request (узел «Input Your Website URL»).
  • Метод: GET
  • URL: адрес сайта, например https://atlex.ru (можно сделать динамическим).
  • Формат ответа: String (чтобы получить HTML-код).

Создаём триггер

Шаг 3. Конвертируем HTML в Markdown

  • Добавьте узел Convert to Markdown Format.
  • Входные данные: {{$json.data}} из предыдущего узла.
  • Это упрощает текст для ИИ, убирает теги и лишний код.

Создаём триггер

Шаг 4. Анализируем контент с помощью chatGPT

  • Добавьте узел OpenAI (LangChain) под названием «Process the Markdown to readable Contents».
  • Модель: gpt-4.1-mini (оптимально по цене и скорости).
  • В системное сообщение добавьте инструкцию: "Дай краткое описание сайта (цель, аудитория, услуги) и выдели 10 ключевых элементов: заголовок, метаописание, услуги, CTA, контакты, навигация и т.д."
  • Вставьте текст из узла конвертации: {{$json.HTMLtoMarkDownConversion}}.
  • Настройте API-ключ OpenAI в credentials.

Анализируем контент с помощью chatGPT

Шаг 5. Сохраняем результат в Google Sheets

Как настроить Google Credentials в n8n.

  • Добавьте узел Google Sheets («Save the Website Scraping content to Google Sheet»).
  • Операция: Update или Append (в зависимости от задачи).
  • Укажите Document ID и Sheet Name.
  • Настройте соответствие полей (summary → колонка "Описание", key points → колонка "Ключевые данные").
  • Подключите OAuth2-авторизацию Google.

Сохраняем результат в Google Sheets

Шаг 6. Добавляем заметку с инструкцией (опционально)

Узел Sticky Note с кратким описанием workflow и подсказками по настройке.

Шаг 7. Проверка работы

  • Запустите workflow вручную.
  • Убедитесь, что данные корректно попадают в Google Sheets.

3. Возможные ошибки и их решение

  • Сайт не загружается — проверьте корректность URL.
  • Пустой результат — возможно, сайт полностью рендерится через JavaScript, используйте альтернативные способы парсинга.
  • Ошибка авторизации OpenAI или Google — обновите API-ключ или токен.
  • Данные не записываются — проверьте права доступа к Google Sheet и правильность указанных ID.

Заключение

С помощью этого workflow в n8n вы можете полностью автоматизировать анализ контента сайтов и быстро получать структурированные данные прямо в Google Sheets. Это экономит часы ручной работы и позволяет сосредоточиться на принятии решений, а не на рутинных задачах.

Скачать готовый workflow: Автоматизация анализа контента сайта с помощью n8n и Google Sheets

А теперь — шаг к максимальной эффективности!

Чтобы ваш workflow работал быстро, надёжно и без перебоев, особенно при больших объёмах данных, вам нужен мощный и стабильный сервер.

Мы предоставляем высокопроизводительные VPS в России и Европе — с низкой задержкой, гарантированными ресурсами и полной свободой конфигурации.

Закажите VPS уже сегодня и ускорьте свои бизнес-процессы!

Для реализации основных услуг и функций нашего сайта, а также для сбора данных о том, как посетители взаимодействуют с нашими сайтом, продуктами и услугами, мы применяем различные инструменты, включая файлы cookie. Нажимая «Принимаю», вы соглашаетесь с текущими правилами и условиями использования сайта и даете разрешение на использование этих данных. В противном случае, пожалуйста, покиньте сайт.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Seraphinite AcceleratorOptimized by Seraphinite Accelerator
Turns on site high speed to be attractive for people and search engines.