使用 Java-Regex 與 Regex 成對拆分多行文本 (Split text with Java-Regex in pairs with Regex over several lines)


問題描述

使用 Java‑Regex 與 Regex 成對拆分多行文本 (Split text with Java‑Regex in pairs with Regex over several lines)

I have following text:

my‑widget{
  color: #{mycolors.getColors(1)}
}
...
my‑tridget{
  color: #{mycolors.getColors(2)}
  ...
}
...

I want to split the text in pairs, where the delimiter is #{mycolors.getColors()} and the text between previous delimeter and current delimiter will be saved. E.g. for such pairs:

Pair 1:       text:   my‑widget{       color:       number: 1

Pair 2:       text: }     ...     my‑tridget{       color:     number:           2

What I am used so far,

 Pattern p = Pattern.compile("(.*)#\\{mycolors.getColor\\(([0‑9])\\)\\}", Pattern.CASE_INSENSITIVE|Pattern.MULTILINE);
    Matcher m = p.matcher(data);

 while (m.find){
     String number = m.group(2).toLowerCase().trim();
     String text = m.group(1);          
 }

But number and text will be to:

text:   color: number: 1

text:   color: number: 2

So the text doesn't go over several lines. How can I achieve this ? (The Pattern.DOTALL in addtion to Pattern.MULTILINE didn't help me)


參考解法

方法 1:

Some mistakes you're making:

  1. To match text across multiple lines you need to use Pattern.DOTALL instead of Pattern.MULTILINE
  2. Instead of .* make it non greedy .*?
  3. Your text has string getColors but you have getColor in your regex

Following regex pattern should work out for you:

Pattern p = Pattern.compile("(.*?)#\\{mycolors.getColors\\((\\d+)\\)\\}", 
                            Pattern.CASE_INSENSITIVE|Pattern.DOTALL);

(by Tonyanubhava)

參考文件

  1. Split text with Java‑Regex in pairs with Regex over several lines (CC BY‑SA 3.0/4.0)

#split #java #RegEx






相關問題

將 xml 元素內容拆分為固定行數 (Split xml element content into fix number of lines)

是否有任何標准說明“aba”.split(/a/) 是否應該返回 1,2 或 3 個元素? (Is there any standard which says if "aba".split(/a/) should return 1,2, or 3 elements?)

Cố gắng gọi các phương thức trong phương thức main với biến được khởi tạo trong các phương thức khác (Trying to call methods in main method with variable initialized in other methods)

使用 Java-Regex 與 Regex 成對拆分多行文本 (Split text with Java-Regex in pairs with Regex over several lines)

如何分割字節數組 (How to split a byte array)

String componentsSeparatedByString 做一次 (String componentsSeparatedByString do one time)

從一行文本中獲取特定數據 (Get specific data from a line of text)

(Python)拆分字符串多個分隔符更有效?1) 使用多重替換方法然後使用拆分 2) 使用正則表達式 ((Python) which is more efficient to split a string multiple separators? 1) Using multiple replace method then using split 2) using regular Expressions)

ValueError:發現樣本數量不一致的輸入變量:[2935848、2935849] (ValueError: Found input variables with inconsistent numbers of samples: [2935848, 2935849])

在 Powershell 中拆分和添加字符串 (Splitting and Adding String in Powershell)

在 python 函數中檢查月份的有效性時出錯 (Error in checking validity of month in python function)

如何將 .obj 文件拆分為其他兩個文件(python、open3d)? (How to split a .obj file into two other files (python, open3d)?)







留言討論