[Delphi]Вопрос про парсинг HRML пайпал

Dager315

Carder
Messages
68
Reaction score
3
Points
8
Сабж. у кого есть примеры работы с парсингом HTML, если есть примеры работы с парсингом палки, будьте любезны, скиньте в тему или в пм, я буду вам очень благодарен!)
 
что именно парсить то нужно ?

p.s. это вопрос из серии: иди туда не знаю куда, возьми то не знаю что ?
 
Нужно имя, адрес, вериф или нет, тип ака(перс, беизнес, премьер), баланс, наличие карты, банк ака.
 
Нужно имя, адрес, вериф или нет, тип ака(перс, беизнес, премьер), баланс, наличие карты, банк ака.

ну тк обширно) Юзай Pas и Copy построчно, т.е грузишь в стринг лист код и построчно юзаешь функции. Мож кто то предложит другой вариант?
 
ну тк обширно) Юзай Pas и Copy построчно, т.е грузишь в стринг лист код и построчно юзаешь функции. Мож кто то предложит другой вариант?

Z юзаю delete и pos.Но дело в том что почему то у меня они записываются с левыми символами, вот я и спрашиваю есть ли у кого исходник что бы не искать теги для вывода инфы.

Кусок кода который должен выдернуть ссылку на вход с главной страницы.
Code:
PPlink:=idhttp1.get('https://www.paypal.com/pt/');
Delete(pplink,1,pos('<form method="post" id="rosetta" class="rosetta" action=",pplink)+length('"><fieldset><legend>Member Log ')-1);
Delete(pplink,pos('">',pplink),length(pplink));
 
Last edited:
для того чтобы парсить страницу с данными холдера нужно послать около 5 запросов только чтобы войти в палку. Если же ты авторизоваться не можешь то думаю бесполезно тебе давать какой-либо код ;)
 
Я просто отправляю пост запрос и он нормально входит, только надо чуть по лучше продумать алгоритм проверки входа, а то там иногда перекидывает не в сам акк.
 
Last edited:
Все реализовано, кибер был прав, запросов я отправляю несколько, но теперь та же проблема с парсингом, copy и pos не помогают, почему то не могу с ними совладать, может я как то не так сохраняю файл, делаю все через мемо, тоесть добавляю код страницы в мемо и ищу его там, не получается, может что посоветуете?
 
Попробуй так, только все на словах, в делпфи далёк, на другом языке делал подобное.
Открываешь исходный код, удаляешь все до определённого тега, потом идет слово какое-то, после него еще тег, удаляешь второй тег после слова и получаешь результат, и так весь текст. Тем более парсинг можно устроить так же по словам Balance, Status и т.д. Просто нужно удалять не нужное, и выбирать самое главное.
Подведем итог:
1. Открываешь код страницы программно.
2. Выбираешь все нужное путём удаления теста до тегов и тег тоже дел.
3. Вычищаешь весь мусор который может попасть.
4. Записываешь результат построчно в файл.
Вот и весь парсинг-) Потренируйся на куске исходного кода, а потом весь алгоритм соберёшь.
 
Все реализовано, кибер был прав, запросов я отправляю несколько, но теперь та же проблема с парсингом, copy и pos не помогают, почему то не могу с ними совладать, может я как то не так сохраняю файл, делаю все через мемо, тоесть добавляю код страницы в мемо и ищу его там, не получается, может что посоветуете?

смотри инфу по функциям copy, pos, delete, без них имхо не справиться. В мемо не нужно добавлять, создай обычную переменную типа string, туда скидывай содержание страницы и вырезай/копируй оттуда нужные параметры

правильно Passion говорит, нужно по определенным ключевым словам работать, скажем нужно вырвать баланс, соответственно ищем его в коде и отрезаем не нужное или наоборот копируем из общей массы то что нужно
 
Через стринг переменную тоже пробовал, почему то в showmesaage вылазит или один левый символ как правило D, или первая строка страницы.

word:=Copy(page1, pos('paypal balance:',page1)+46,pos('paypal balance:',page1)+67) ;
showmessage(word);

Вот код, почему то выводит первую строку в хтмл.
 
paypal balance:
а этот текст вообще встречается в палке ? Ты парси не то, как тебе хотелось бы парсить, а по реальному коду
 
paypal balance:
а этот текст вообще встречается в палке ? Ты парси не то, как тебе хотелось бы парсить, а по реальному коду

Само собой уж, я же не дурак))

Вот кусок искодного кода с балансом
Code:
</div><div id="messageBox"></div><div id="main"><div class="layout2c"><div class="col first"><div class="box multi"><div class="head"><h3>PayPal balance: <span class="balance">
<!--googleoff: all-->
$0.00 USD
<!--googleon: all-->
 
pos чувствителен к регистру поэтому нужно так
word:=Copy(page1, pos('PayPal balance:',page1)+46,pos('PayPal balance:',page1)+67) ;
showmessage(word);

по идее ;)
 
pos чувствителен к регистру поэтому нужно так
word:=Copy(page1, pos('PayPal balance:',page1)+46,pos('PayPal balance:',page1)+67) ;
showmessage(word);

по идее ;)

Спасибо тебе, очень помог.
 
Top