What's new

[SOLVED] RegEx (Regular Expression) issue

maki

Member
Joined
Jul 5, 2015
Messages
225
Can some programmer correct me regex to work in both cases?

Code:
(?<=<br>)[^\\\[\]\{\}]*?(?=(</br>|<br>))
Code:
<br>Обожаю животных и растения.  Увлекаюсь аниме  , сериалами  и чтением . Последнее наверное самое любимое.   Я восхищаюсь  книгами \"Дом , в котором. .. \" , \" Дом странных детей \" , \" Скотный  двор \" , \" Рыцарь на золотом коне \" . На самом деле могу продолжать этот список целую вечность.  Книги для меня - способ уйти от проблем и погрузиться в удивительный,  сказочный мир.<br>
not working



Code:
<br>Обожаю животных и растения<br>
working
 

xilolee

Moderator
Staff member
Joined
Dec 31, 2013
Messages
2,312
Location
World, Europe, Italy
Not a programmer and not an expert in RegEx, but you could try this one:
(?<=<br>)[^\\\[\]\{\}]*?(?=(<\/br>|<br>))
Note: it seems positive lookbehind won't work in JavaScript:
Code:
(?<=xxx)
 
Last edited:

maki

Member
Joined
Jul 5, 2015
Messages
225
Regex does not work because the text is:
Code:
\"

Please still correct Regex.
 

maki

Member
Joined
Jul 5, 2015
Messages
225
other tags, here nothing to detect[FONT=&quot]<br>[/FONT][FONT=&quot]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT=&quot]<b><b>[/FONT][FONT=&quot]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT=&quot]<br></br><br>[/FONT][FONT=&quot]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT=&quot]<b><b>[/FONT][FONT=&quot]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT=&quot]</br>[/FONT]other tags, other code here nothing to detect

[FONT=&quot]So I want to detect everything between these tags and only the tags and <b><b> or <b></br>[/FONT]
[FONT=&quot]Understand?

E X A M P L E
[/FONT]
Jhs-ajanxsm " =-0 ///ddcwedcwedcwcfwecfecfewecfe<br><br>Ищу человека, ищу!<br><br>Рассной особе. Начнем-с?<br><br>Раз. Я дико люи \/однаю.<br><br>Два. Музы вмиг.<br><br>Три. Рисую, а если точнее, срисовываю. Плохо, правда, срисовываю, но некоторым нравится. Это что-то типа через раз получается. И обязательно с чашкой чая \\0\/<br><br>Четыре. Пишу фанфики и просто истории. Кроме того, я и ролевик тоже.<br><br>Пять. Запоями читаю книги. Или не читаю неделями, вместочто вспомнить сейчас почти что нереально. Как и сериалы. Но сейчас я зависла на сериале "Сотня". Иногда удивляюсь, почему у него такой низкий рейтинг?..<br><br>Шестакое счастье с:<br><br>Забыла сказать садевчонки\/мальчишки могут дать нам интересную тему для рассуждений. Так что, удачи Вам, если Вы захотели написать мне письмо.<br><br>P.S. Если у Вас есть какая-то проблема, Вы так же можете мне написать. Ведь лучше, когда выговоришься, не правда ли?<br>xasxaxsxsaxcscsdcsd SXWSXK 089MMS=-0 (((


 

maki

Member
Joined
Jul 5, 2015
Messages
225
[h=2][FONT=&quot]Regular Expression Syntax[/FONT][/h][FONT=&quot]EmEditor regular expression syntax is based on Perl regular expression syntax.

[/FONT]
http://www.emeditor.org/en/howto_search_search_regexp_syntax.html
 

AceInfinity

Moderator, Programming, Contributor
Joined
Feb 21, 2012
Messages
1,729
Location
Canada
other tags, here nothing to detect[FONT="]<br>[/FONT][/COLOR][COLOR=#FF0000][FONT="]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT="]<b><b>[/FONT][/COLOR][COLOR=#FF0000][FONT="]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT="]<br></br><br>[/FONT][/COLOR][COLOR=#FF0000][FONT="]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT="]<b><b>[/FONT][/COLOR][COLOR=#FF0000][FONT="]Here can include all letters, numbers, all characters, unicode, everything[/FONT][FONT="]</br>[/FONT][/COLOR][COLOR=#ff8c00]other tags, other code here nothing to detect[/COLOR]

[COLOR=#000000][FONT="]So I want to detect everything between these tags and only the tags and <b><b> or <b></br>[/FONT]

[FONT="]Understand?

E X A M P L E
[/FONT]
Jhs-ajanxsm " =-0 ///ddcwedcwedcwcfwecfecfewecfe<br><br>Ищу человека, ищу!<br><br>Рассной особе. Начнем-с?<br><br>Раз. Я дико люи \/однаю.<br><br>Два. Музы вмиг.<br><br>Три. Рисую, а если точнее, срисовываю. Плохо, правда, срисовываю, но некоторым нравится. Это что-то типа через раз получается. И обязательно с чашкой чая \\0\/<br><br>Четыре. Пишу фанфики и просто истории. Кроме того, я и ролевик тоже.<br><br>Пять. Запоями читаю книги. Или не читаю неделями, вместочто вспомнить сейчас почти что нереально. Как и сериалы. Но сейчас я зависла на сериале "Сотня". Иногда удивляюсь, почему у него такой низкий рейтинг?..<br><br>Шестакое счастье с:<br><br>Забыла сказать садевчонки\/мальчишки могут дать нам интересную тему для рассуждений. Так что, удачи Вам, если Вы захотели написать мне письмо.<br><br>P.S. Если у Вас есть какая-то проблема, Вы так же можете мне написать. Ведь лучше, когда выговоришься, не правда ли?<br>xasxaxsxsaxcscsdcsd SXWSXK 089MMS=-0 (((


Hold on. Above you're trying to match <br> with another tag, but here you say you want to match <b> with either <b> or </br>, so which one is the correct one?

edit: This one seems to work for the first post:


You were negating \ which was contained in the first one.
 
Last edited:

xilolee

Moderator
Staff member
Joined
Dec 31, 2013
Messages
2,312
Location
World, Europe, Italy
Jhs-ajanxsm " =-0 ///ddcwedcwedcwcfwecfecfewecfe<br><br>Ищу человека, ищу!<br><br>Рассной особе. Начнем-с?<br><br>Раз. Я дико люи \/однаю.<br><br>Два. Музы вмиг.<br><br>Три. Рисую, а если точнее, срисовываю. Плохо, правда, срисовываю, но некоторым нравится. Это что-то типа через раз получается. И обязательно с чашкой чая \\0\/<br><br>Четыре. Пишу фанфики и просто истории. Кроме того, я и ролевик тоже.<br><br>Пять. Запоями читаю книги. Или не читаю неделями, вместочто вспомнить сейчас почти что нереально. Как и сериалы. Но сейчас я зависла на сериале "Сотня". Иногда удивляюсь, почему у него такой низкий рейтинг?..<br><br>Шестакое счастье с:<br><br>Забыла сказать садевчонки\/мальчишки могут дать нам интересную тему для рассуждений. Так что, удачи Вам, если Вы захотели написать мне письмо.<br><br>P.S. Если у Вас есть какая-то проблема, Вы так же можете мне написать. Ведь лучше, когда выговоришься, не правда ли?<br>xasxaxsxsaxcscsdcsd SXWSXK 089MMS=-0 (((
If it has to exclude orange parts, this code seems to work (in php and python):
(?<=<br>).[^\[\]\{\}]*?(?<=<br>)
 

maki

Member
Joined
Jul 5, 2015
Messages
225
(?<=<br>).[^\[\]\{\}]*?(?<=<br>)

I added </br> and now it works.

(?<=<br>).[^\[\]\{\}]*?(?<=<br>|</br>)
 

AceInfinity

Moderator, Programming, Contributor
Joined
Feb 21, 2012
Messages
1,729
Location
Canada
Still incorrect regex!
Incorrect matches or mismatched fit.

That's because originally you posted between <br> and <br> not <br> and </br>. It seems your question was missing pieces; you're not going to get the right answer. I'm still confused on this though as your description of what you were trying to match still isn't clear to me.

Glad you got it working
 
Last edited:

maki

Member
Joined
Jul 5, 2015
Messages
225
AceInfinity -
Depending on what I use the Regex engine, it will not work.
I want to use Regex++:Boost.Regex 1.5.7 (though I can still choose Onigmo Regex {work}), but it does not work for this engine.
Boost.Regex:
[Window Title]




[Main Instruction]
The regular expression contains a syntax error.
(?<=<br>).[^\[\]\{\}]*?(?<=<br>|</br>)
 

AceInfinity

Moderator, Programming, Contributor
Joined
Feb 21, 2012
Messages
1,729
Location
Canada
That's because my pattern was manipulated incorrectly.

I had (?<=<br>).[^\[\]\{\}]*?(?=<br>)
not (?<=<br>).[^\[\]\{\}]*?(?<=<br>) <- which is invalid.

I had a look AHEAD there not a look BEHIND -- before you guys added </br> which wasn't specified by you in the first post. You only specified <br> not </br> and stated that it was "Still incorrect regex!" but in your last post where you used mine you had text which added </br> which was never mentioned at anytime previously within this thread, so my regex was never meant to deal with </br>.

All I'm saying is that you need to be explicit with what your question is or you'll never get the right regex to accommodate for all possibilities.
 
Last edited:

maki

Member
Joined
Jul 5, 2015
Messages
225
Regex:
Code:
(?<=<br>).[^\[\]\{\}]*?(?=<br>|</br>)
Tag:
<br>1</br><br>Gjhsxbn\/-_:.<br>
Code:
Extract:
Extract Options:
Display Matched Strings Only
Code:
1
Gjhsxbn\/-_:.
Works :)
 
Top