System.Data.SQLite
Hex Artifact Content
Not logged in

Artifact a68d25c659bd2d893cd1215667bbf75ecb9dc7d4:


0000: 2f 2a 0a 2a 2a 20 32 30 31 32 2d 31 31 2d 31 33  /*.** 2012-11-13
0010: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75 74 68 6f  .**.** The autho
0020: 72 20 64 69 73 63 6c 61 69 6d 73 20 63 6f 70 79  r disclaims copy
0030: 72 69 67 68 74 20 74 6f 20 74 68 69 73 20 73 6f  right to this so
0040: 75 72 63 65 20 63 6f 64 65 2e 20 20 49 6e 20 70  urce code.  In p
0050: 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20 6c 65 67  lace of.** a leg
0060: 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65 72 65 20  al notice, here 
0070: 69 73 20 61 20 62 6c 65 73 73 69 6e 67 3a 0a 2a  is a blessing:.*
0080: 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79 6f 75 20  *.**    May you 
0090: 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e 6f 74 20  do good and not 
00a0: 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  evil..**    May 
00b0: 79 6f 75 20 66 69 6e 64 20 66 6f 72 67 69 76 65  you find forgive
00c0: 6e 65 73 73 20 66 6f 72 20 79 6f 75 72 73 65 6c  ness for yoursel
00d0: 66 20 61 6e 64 20 66 6f 72 67 69 76 65 20 6f 74  f and forgive ot
00e0: 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  hers..**    May 
00f0: 79 6f 75 20 73 68 61 72 65 20 66 72 65 65 6c 79  you share freely
0100: 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e 67 20 6d  , never taking m
0110: 6f 72 65 20 74 68 61 6e 20 79 6f 75 20 67 69 76  ore than you giv
0120: 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  e..**.**********
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 2a 2a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 63  ****.**.** The c
0180: 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c 65  ode in this file
0190: 20 69 6d 70 6c 65 6d 65 6e 74 73 20 61 20 63 6f   implements a co
01a0: 6d 70 61 63 74 20 62 75 74 20 72 65 61 73 6f 6e  mpact but reason
01b0: 61 62 6c 79 0a 2a 2a 20 65 66 66 69 63 69 65 6e  ably.** efficien
01c0: 74 20 72 65 67 75 6c 61 72 2d 65 78 70 72 65 73  t regular-expres
01d0: 73 69 6f 6e 20 6d 61 74 63 68 65 72 20 66 6f 72  sion matcher for
01e0: 20 70 6f 73 69 78 20 65 78 74 65 6e 64 65 64 20   posix extended 
01f0: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0200: 73 73 69 6f 6e 73 20 61 67 61 69 6e 73 74 20 55  ssions against U
0210: 54 46 38 20 74 65 78 74 2e 0a 2a 2a 0a 2a 2a 20  TF8 text..**.** 
0220: 54 68 69 73 20 66 69 6c 65 20 69 73 20 61 6e 20  This file is an 
0230: 53 51 4c 69 74 65 20 65 78 74 65 6e 73 69 6f 6e  SQLite extension
0240: 2e 20 20 49 74 20 72 65 67 69 73 74 65 72 73 20  .  It registers 
0250: 61 20 73 69 6e 67 6c 65 20 66 75 6e 63 74 69 6f  a single functio
0260: 6e 0a 2a 2a 20 6e 61 6d 65 64 20 22 72 65 67 65  n.** named "rege
0270: 78 70 28 41 2c 42 29 22 20 77 68 65 72 65 20 41  xp(A,B)" where A
0280: 20 69 73 20 74 68 65 20 72 65 67 75 6c 61 72 20   is the regular 
0290: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 42  expression and B
02a0: 20 69 73 20 74 68 65 0a 2a 2a 20 73 74 72 69 6e   is the.** strin
02b0: 67 20 74 6f 20 62 65 20 6d 61 74 63 68 65 64 2e  g to be matched.
02c0: 20 20 42 79 20 72 65 67 69 73 74 65 72 69 6e 67    By registering
02d0: 20 74 68 69 73 20 66 75 6e 63 74 69 6f 6e 2c 20   this function, 
02e0: 53 51 4c 69 74 65 20 77 69 6c 6c 20 61 6c 73 6f  SQLite will also
02f0: 0a 2a 2a 20 74 68 65 6e 20 69 6d 70 6c 65 6d 65  .** then impleme
0300: 6e 74 20 74 68 65 20 22 42 20 72 65 67 65 78 70  nt the "B regexp
0310: 20 41 22 20 6f 70 65 72 61 74 6f 72 2e 20 20 4e   A" operator.  N
0320: 6f 74 65 20 74 68 61 74 20 77 69 74 68 20 74 68  ote that with th
0330: 65 20 66 75 6e 63 74 69 6f 6e 0a 2a 2a 20 74 68  e function.** th
0340: 65 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73  e regular expres
0350: 73 69 6f 6e 20 63 6f 6d 65 73 20 66 69 72 73 74  sion comes first
0360: 2c 20 62 75 74 20 77 69 74 68 20 74 68 65 20 6f  , but with the o
0370: 70 65 72 61 74 6f 72 20 69 74 20 63 6f 6d 65 73  perator it comes
0380: 0a 2a 2a 20 73 65 63 6f 6e 64 2e 0a 2a 2a 0a 2a  .** second..**.*
0390: 2a 20 20 54 68 65 20 66 6f 6c 6c 6f 77 69 6e 67  *  The following
03a0: 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73   regular express
03b0: 69 6f 6e 20 73 79 6e 74 61 78 20 69 73 20 73 75  ion syntax is su
03c0: 70 70 6f 72 74 65 64 3a 0a 2a 2a 0a 2a 2a 20 20  pported:.**.**  
03d0: 20 20 20 58 2a 20 20 20 20 20 20 7a 65 72 6f 20     X*      zero 
03e0: 6f 72 20 6d 6f 72 65 20 6f 63 63 75 72 72 65 6e  or more occurren
03f0: 63 65 73 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20  ces of X.**     
0400: 58 2b 20 20 20 20 20 20 6f 6e 65 20 6f 72 20 6d  X+      one or m
0410: 6f 72 65 20 6f 63 63 75 72 72 65 6e 63 65 73 20  ore occurrences 
0420: 6f 66 20 58 0a 2a 2a 20 20 20 20 20 58 3f 20 20  of X.**     X?  
0430: 20 20 20 20 7a 65 72 6f 20 6f 72 20 6f 6e 65 20      zero or one 
0440: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0450: 0a 2a 2a 20 20 20 20 20 58 7b 70 2c 71 7d 20 20  .**     X{p,q}  
0460: 62 65 74 77 65 65 6e 20 70 20 61 6e 64 20 71 20  between p and q 
0470: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0480: 0a 2a 2a 20 20 20 20 20 28 58 29 20 20 20 20 20  .**     (X)     
0490: 6d 61 74 63 68 20 58 0a 2a 2a 20 20 20 20 20 58  match X.**     X
04a0: 7c 59 20 20 20 20 20 58 20 6f 72 20 59 0a 2a 2a  |Y     X or Y.**
04b0: 20 20 20 20 20 5e 58 20 20 20 20 20 20 58 20 6f       ^X      X o
04c0: 63 63 75 72 72 69 6e 67 20 61 74 20 74 68 65 20  ccurring at the 
04d0: 62 65 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65  beginning of the
04e0: 20 73 74 72 69 6e 67 0a 2a 2a 20 20 20 20 20 58   string.**     X
04f0: 24 20 20 20 20 20 20 58 20 6f 63 63 75 72 72 69  $      X occurri
0500: 6e 67 20 61 74 20 74 68 65 20 65 6e 64 20 6f 66  ng at the end of
0510: 20 74 68 65 20 73 74 72 69 6e 67 0a 2a 2a 20 20   the string.**  
0520: 20 20 20 2e 20 20 20 20 20 20 20 4d 61 74 63 68     .       Match
0530: 20 61 6e 79 20 73 69 6e 67 6c 65 20 63 68 61 72   any single char
0540: 61 63 74 65 72 0a 2a 2a 20 20 20 20 20 5c 63 20  acter.**     \c 
0550: 20 20 20 20 20 43 68 61 72 61 63 74 65 72 20 63       Character c
0560: 20 77 68 65 72 65 20 63 20 69 73 20 6f 6e 65 20   where c is one 
0570: 6f 66 20 5c 7b 7d 28 29 5b 5d 7c 2a 2b 3f 2e 0a  of \{}()[]|*+?..
0580: 2a 2a 20 20 20 20 20 5c 63 20 20 20 20 20 20 43  **     \c      C
0590: 2d 6c 61 6e 67 75 61 67 65 20 65 73 63 61 70 65  -language escape
05a0: 73 20 66 6f 72 20 63 20 69 6e 20 61 66 6e 72 74  s for c in afnrt
05b0: 76 2e 20 20 65 78 3a 20 5c 74 20 6f 72 20 5c 6e  v.  ex: \t or \n
05c0: 0a 2a 2a 20 20 20 20 20 5c 75 58 58 58 58 20 20  .**     \uXXXX  
05d0: 57 68 65 72 65 20 58 58 58 58 20 69 73 20 65 78  Where XXXX is ex
05e0: 61 63 74 6c 79 20 34 20 68 65 78 20 64 69 67 69  actly 4 hex digi
05f0: 74 73 2c 20 75 6e 69 63 6f 64 65 20 76 61 6c 75  ts, unicode valu
0600: 65 20 58 58 58 58 0a 2a 2a 20 20 20 20 20 5c 78  e XXXX.**     \x
0610: 58 58 20 20 20 20 57 68 65 72 65 20 58 58 20 69  XX    Where XX i
0620: 73 20 65 78 61 63 74 6c 79 20 32 20 68 65 78 20  s exactly 2 hex 
0630: 64 69 67 69 74 73 2c 20 75 6e 69 63 6f 64 65 20  digits, unicode 
0640: 76 61 6c 75 65 20 58 58 0a 2a 2a 20 20 20 20 20  value XX.**     
0650: 5b 61 62 63 5d 20 20 20 41 6e 79 20 73 69 6e 67  [abc]   Any sing
0660: 6c 65 20 63 68 61 72 61 63 74 65 72 20 66 72 6f  le character fro
0670: 6d 20 74 68 65 20 73 65 74 20 61 62 63 0a 2a 2a  m the set abc.**
0680: 20 20 20 20 20 5b 5e 61 62 63 5d 20 20 41 6e 79       [^abc]  Any
0690: 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63 74 65   single characte
06a0: 72 20 6e 6f 74 20 69 6e 20 74 68 65 20 73 65 74  r not in the set
06b0: 20 61 62 63 0a 2a 2a 20 20 20 20 20 5b 61 2d 7a   abc.**     [a-z
06c0: 5d 20 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63  ]   Any single c
06d0: 68 61 72 61 63 74 65 72 20 69 6e 20 74 68 65 20  haracter in the 
06e0: 72 61 6e 67 65 20 61 2d 7a 0a 2a 2a 20 20 20 20  range a-z.**    
06f0: 20 5b 5e 61 2d 7a 5d 20 20 41 6e 79 20 73 69 6e   [^a-z]  Any sin
0700: 67 6c 65 20 63 68 61 72 61 63 74 65 72 20 6e 6f  gle character no
0710: 74 20 69 6e 20 74 68 65 20 72 61 6e 67 65 20 61  t in the range a
0720: 2d 7a 0a 2a 2a 20 20 20 20 20 5c 62 20 20 20 20  -z.**     \b    
0730: 20 20 57 6f 72 64 20 62 6f 75 6e 64 61 72 79 0a    Word boundary.
0740: 2a 2a 20 20 20 20 20 5c 77 20 20 20 20 20 20 57  **     \w      W
0750: 6f 72 64 20 63 68 61 72 61 63 74 65 72 2e 20 20  ord character.  
0760: 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 0a 2a 2a 20  [A-Za-z0-9_].** 
0770: 20 20 20 20 5c 57 20 20 20 20 20 20 4e 6f 6e 2d      \W      Non-
0780: 77 6f 72 64 20 63 68 61 72 61 63 74 65 72 0a 2a  word character.*
0790: 2a 20 20 20 20 20 5c 64 20 20 20 20 20 20 44 69  *     \d      Di
07a0: 67 69 74 0a 2a 2a 20 20 20 20 20 5c 44 20 20 20  git.**     \D   
07b0: 20 20 20 4e 6f 6e 2d 64 69 67 69 74 0a 2a 2a 20     Non-digit.** 
07c0: 20 20 20 20 5c 73 20 20 20 20 20 20 57 68 69 74      \s      Whit
07d0: 65 73 70 61 63 65 20 63 68 61 72 61 63 74 65 72  espace character
07e0: 0a 2a 2a 20 20 20 20 20 5c 53 20 20 20 20 20 20  .**     \S      
07f0: 4e 6f 6e 2d 77 68 69 74 65 73 70 61 63 65 20 63  Non-whitespace c
0800: 68 61 72 61 63 74 65 72 0a 2a 2a 0a 2a 2a 20 41  haracter.**.** A
0810: 20 6e 6f 6e 64 65 74 65 72 6d 69 6e 69 73 74 69   nondeterministi
0820: 63 20 66 69 6e 69 74 65 20 61 75 74 6f 6d 61 74  c finite automat
0830: 6f 6e 20 28 4e 46 41 29 20 69 73 20 75 73 65 64  on (NFA) is used
0840: 20 66 6f 72 20 6d 61 74 63 68 69 6e 67 2c 20 73   for matching, s
0850: 6f 20 74 68 65 0a 2a 2a 20 70 65 72 66 6f 72 6d  o the.** perform
0860: 61 6e 63 65 20 69 73 20 62 6f 75 6e 64 65 64 20  ance is bounded 
0870: 62 79 20 4f 28 4e 2a 4d 29 20 77 68 65 72 65 20  by O(N*M) where 
0880: 4e 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66  N is the size of
0890: 20 74 68 65 20 72 65 67 75 6c 61 72 0a 2a 2a 20   the regular.** 
08a0: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 4d  expression and M
08b0: 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66 20   is the size of 
08c0: 74 68 65 20 69 6e 70 75 74 20 73 74 72 69 6e 67  the input string
08d0: 2e 20 20 54 68 65 20 6d 61 74 63 68 65 72 20 6e  .  The matcher n
08e0: 65 76 65 72 0a 2a 2a 20 65 78 68 69 62 69 74 73  ever.** exhibits
08f0: 20 65 78 70 6f 6e 65 6e 74 69 61 6c 20 62 65 68   exponential beh
0900: 61 76 69 6f 72 2e 20 20 4e 6f 74 65 20 74 68 61  avior.  Note tha
0910: 74 20 74 68 65 20 58 7b 70 2c 71 7d 20 6f 70 65  t the X{p,q} ope
0920: 72 61 74 6f 72 20 65 78 70 61 6e 64 73 0a 2a 2a  rator expands.**
0930: 20 74 6f 20 70 20 63 6f 70 69 65 73 20 6f 66 20   to p copies of 
0940: 58 20 66 6f 6c 6c 6f 77 69 6e 67 20 62 79 20 71  X following by q
0950: 2d 70 20 63 6f 70 69 65 73 20 6f 66 20 58 3f 20  -p copies of X? 
0960: 61 6e 64 20 74 68 61 74 20 74 68 65 20 73 69 7a  and that the siz
0970: 65 20 6f 66 20 74 68 65 0a 2a 2a 20 72 65 67 75  e of the.** regu
0980: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69  lar expression i
0990: 6e 20 74 68 65 20 4f 28 4e 2a 4d 29 20 70 65 72  n the O(N*M) per
09a0: 66 6f 72 6d 61 6e 63 65 20 62 6f 75 6e 64 20 69  formance bound i
09b0: 73 20 63 6f 6d 70 75 74 65 64 20 61 66 74 65 72  s computed after
09c0: 0a 2a 2a 20 74 68 69 73 20 65 78 70 61 6e 73 69  .** this expansi
09d0: 6f 6e 2e 0a 2a 2f 0a 23 69 6e 63 6c 75 64 65 20  on..*/.#include 
09e0: 3c 73 74 72 69 6e 67 2e 68 3e 0a 23 69 6e 63 6c  <string.h>.#incl
09f0: 75 64 65 20 3c 73 74 64 6c 69 62 2e 68 3e 0a 23  ude <stdlib.h>.#
0a00: 69 6e 63 6c 75 64 65 20 22 73 71 6c 69 74 65 33  include "sqlite3
0a10: 65 78 74 2e 68 22 0a 53 51 4c 49 54 45 5f 45 58  ext.h".SQLITE_EX
0a20: 54 45 4e 53 49 4f 4e 5f 49 4e 49 54 31 0a 0a 2f  TENSION_INIT1../
0a30: 2a 0a 2a 2a 20 54 68 65 20 66 6f 6c 6c 6f 77 69  *.** The followi
0a40: 6e 67 20 23 64 65 66 69 6e 65 73 20 63 68 61 6e  ng #defines chan
0a50: 67 65 20 74 68 65 20 6e 61 6d 65 73 20 6f 66 20  ge the names of 
0a60: 73 6f 6d 65 20 66 75 6e 63 74 69 6f 6e 73 20 69  some functions i
0a70: 6d 70 6c 65 6d 65 6e 74 65 64 20 69 6e 0a 2a 2a  mplemented in.**
0a80: 20 74 68 69 73 20 66 69 6c 65 20 74 6f 20 70 72   this file to pr
0a90: 65 76 65 6e 74 20 6e 61 6d 65 20 63 6f 6c 6c 69  event name colli
0aa0: 73 69 6f 6e 73 20 77 69 74 68 20 43 2d 6c 69 62  sions with C-lib
0ab0: 72 61 72 79 20 66 75 6e 63 74 69 6f 6e 73 20 6f  rary functions o
0ac0: 66 20 74 68 65 0a 2a 2a 20 73 61 6d 65 20 6e 61  f the.** same na
0ad0: 6d 65 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 72  me..*/.#define r
0ae0: 65 5f 6d 61 74 63 68 20 20 20 73 71 6c 69 74 65  e_match   sqlite
0af0: 33 72 65 5f 6d 61 74 63 68 0a 23 64 65 66 69 6e  3re_match.#defin
0b00: 65 20 72 65 5f 63 6f 6d 70 69 6c 65 20 73 71 6c  e re_compile sql
0b10: 69 74 65 33 72 65 5f 63 6f 6d 70 69 6c 65 0a 23  ite3re_compile.#
0b20: 64 65 66 69 6e 65 20 72 65 5f 66 72 65 65 20 20  define re_free  
0b30: 20 20 73 71 6c 69 74 65 33 72 65 5f 66 72 65 65    sqlite3re_free
0b40: 0a 0a 2f 2a 20 54 68 65 20 65 6e 64 2d 6f 66 2d  ../* The end-of-
0b50: 69 6e 70 75 74 20 63 68 61 72 61 63 74 65 72 20  input character 
0b60: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 45 4f  */.#define RE_EO
0b70: 46 20 20 20 20 20 20 20 20 20 20 20 20 30 20 20  F            0  
0b80: 20 20 2f 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75    /* End of inpu
0b90: 74 20 2a 2f 0a 0a 2f 2a 20 54 68 65 20 4e 46 41  t */../* The NFA
0ba0: 20 69 73 20 69 6d 70 6c 65 6d 65 6e 74 65 64 20   is implemented 
0bb0: 61 73 20 73 65 71 75 65 6e 63 65 20 6f 66 20 6f  as sequence of o
0bc0: 70 63 6f 64 65 73 20 74 61 6b 65 6e 20 66 72 6f  pcodes taken fro
0bd0: 6d 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 0a  m the following.
0be0: 2a 2a 20 73 65 74 2e 20 20 45 61 63 68 20 6f 70  ** set.  Each op
0bf0: 63 6f 64 65 20 68 61 73 20 61 20 73 69 6e 67 6c  code has a singl
0c00: 65 20 69 6e 74 65 67 65 72 20 61 72 67 75 6d 65  e integer argume
0c10: 6e 74 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 52  nt..*/.#define R
0c20: 45 5f 4f 50 5f 4d 41 54 43 48 20 20 20 20 20 20  E_OP_MATCH      
0c30: 20 31 20 20 20 20 2f 2a 20 4d 61 74 63 68 20 74   1    /* Match t
0c40: 68 65 20 6f 6e 65 20 63 68 61 72 61 63 74 65 72  he one character
0c50: 20 69 6e 20 74 68 65 20 61 72 67 75 6d 65 6e 74   in the argument
0c60: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0c70: 50 5f 41 4e 59 20 20 20 20 20 20 20 20 20 32 20  P_ANY         2 
0c80: 20 20 20 2f 2a 20 4d 61 74 63 68 20 61 6e 79 20     /* Match any 
0c90: 6f 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20  one character.  
0ca0: 28 49 6d 70 6c 65 6d 65 6e 74 73 20 22 2e 22 29  (Implements ".")
0cb0: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0cc0: 50 5f 41 4e 59 53 54 41 52 20 20 20 20 20 33 20  P_ANYSTAR     3 
0cd0: 20 20 20 2f 2a 20 53 70 65 63 69 61 6c 20 6f 70     /* Special op
0ce0: 74 69 6d 69 7a 65 64 20 76 65 72 73 69 6f 6e 20  timized version 
0cf0: 6f 66 20 2e 2a 20 2a 2f 0a 23 64 65 66 69 6e 65  of .* */.#define
0d00: 20 52 45 5f 4f 50 5f 46 4f 52 4b 20 20 20 20 20   RE_OP_FORK     
0d10: 20 20 20 34 20 20 20 20 2f 2a 20 43 6f 6e 74 69     4    /* Conti
0d20: 6e 75 65 20 74 6f 20 62 6f 74 68 20 6e 65 78 74  nue to both next
0d30: 20 61 6e 64 20 6f 70 63 6f 64 65 20 61 74 20 69   and opcode at i
0d40: 41 72 67 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  Arg */.#define R
0d50: 45 5f 4f 50 5f 47 4f 54 4f 20 20 20 20 20 20 20  E_OP_GOTO       
0d60: 20 35 20 20 20 20 2f 2a 20 4a 75 6d 70 20 74 6f   5    /* Jump to
0d70: 20 6f 70 63 6f 64 65 20 61 74 20 69 41 72 67 20   opcode at iArg 
0d80: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0d90: 5f 41 43 43 45 50 54 20 20 20 20 20 20 36 20 20  _ACCEPT      6  
0da0: 20 20 2f 2a 20 48 61 6c 74 20 61 6e 64 20 69 6e    /* Halt and in
0db0: 64 69 63 61 74 65 20 61 20 73 75 63 63 65 73 73  dicate a success
0dc0: 66 75 6c 20 6d 61 74 63 68 20 2a 2f 0a 23 64 65  ful match */.#de
0dd0: 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e  fine RE_OP_CC_IN
0de0: 43 20 20 20 20 20 20 37 20 20 20 20 2f 2a 20 42  C      7    /* B
0df0: 65 67 69 6e 6e 69 6e 67 20 6f 66 20 61 20 5b 2e  eginning of a [.
0e00: 2e 2e 5d 20 63 68 61 72 61 63 74 65 72 20 63 6c  ..] character cl
0e10: 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  ass */.#define R
0e20: 45 5f 4f 50 5f 43 43 5f 45 58 43 20 20 20 20 20  E_OP_CC_EXC     
0e30: 20 38 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69   8    /* Beginni
0e40: 6e 67 20 6f 66 20 61 20 5b 5e 2e 2e 2e 5d 20 63  ng of a [^...] c
0e50: 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a  haracter class *
0e60: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
0e70: 43 43 5f 56 41 4c 55 45 20 20 20 20 39 20 20 20  CC_VALUE    9   
0e80: 20 2f 2a 20 53 69 6e 67 6c 65 20 76 61 6c 75 65   /* Single value
0e90: 20 69 6e 20 61 20 63 68 61 72 61 63 74 65 72 20   in a character 
0ea0: 63 6c 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65  class */.#define
0eb0: 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 20   RE_OP_CC_RANGE 
0ec0: 20 20 31 30 20 20 20 20 2f 2a 20 52 61 6e 67 65    10    /* Range
0ed0: 20 6f 66 20 76 61 6c 75 65 73 20 69 6e 20 61 20   of values in a 
0ee0: 63 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20  character class 
0ef0: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0f00: 5f 57 4f 52 44 20 20 20 20 20 20 20 31 31 20 20  _WORD       11  
0f10: 20 20 2f 2a 20 50 65 72 6c 20 77 6f 72 64 20 63    /* Perl word c
0f20: 68 61 72 61 63 74 65 72 20 5b 41 2d 5a 61 2d 7a  haracter [A-Za-z
0f30: 30 2d 39 5f 5d 20 2a 2f 0a 23 64 65 66 69 6e 65  0-9_] */.#define
0f40: 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 20 20   RE_OP_NOTWORD  
0f50: 20 20 31 32 20 20 20 20 2f 2a 20 4e 6f 74 20 61    12    /* Not a
0f60: 20 70 65 72 6c 20 77 6f 72 64 20 63 68 61 72 61   perl word chara
0f70: 63 74 65 72 20 2a 2f 0a 23 64 65 66 69 6e 65 20  cter */.#define 
0f80: 52 45 5f 4f 50 5f 44 49 47 49 54 20 20 20 20 20  RE_OP_DIGIT     
0f90: 20 31 33 20 20 20 20 2f 2a 20 64 69 67 69 74 3a   13    /* digit:
0fa0: 20 20 5b 30 2d 39 5d 20 2a 2f 0a 23 64 65 66 69    [0-9] */.#defi
0fb0: 6e 65 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49  ne RE_OP_NOTDIGI
0fc0: 54 20 20 20 31 34 20 20 20 20 2f 2a 20 4e 6f 74  T   14    /* Not
0fd0: 20 61 20 64 69 67 69 74 20 2a 2f 0a 23 64 65 66   a digit */.#def
0fe0: 69 6e 65 20 52 45 5f 4f 50 5f 53 50 41 43 45 20  ine RE_OP_SPACE 
0ff0: 20 20 20 20 20 31 35 20 20 20 20 2f 2a 20 73 70       15    /* sp
1000: 61 63 65 3a 20 20 5b 20 5c 74 5c 6e 5c 72 5c 76  ace:  [ \t\n\r\v
1010: 5c 66 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  \f] */.#define R
1020: 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 20 20 20  E_OP_NOTSPACE   
1030: 31 36 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 64  16    /* Not a d
1040: 69 67 69 74 20 2a 2f 0a 23 64 65 66 69 6e 65 20  igit */.#define 
1050: 52 45 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 20 20  RE_OP_BOUNDARY  
1060: 20 31 37 20 20 20 20 2f 2a 20 42 6f 75 6e 64 61   17    /* Bounda
1070: 72 79 20 62 65 74 77 65 65 6e 20 77 6f 72 64 20  ry between word 
1080: 61 6e 64 20 6e 6f 6e 2d 77 6f 72 64 20 2a 2f 0a  and non-word */.
1090: 0a 2f 2a 20 45 61 63 68 20 6f 70 63 6f 64 65 20  ./* Each opcode 
10a0: 69 73 20 61 20 22 73 74 61 74 65 22 20 69 6e 20  is a "state" in 
10b0: 74 68 65 20 4e 46 41 20 2a 2f 0a 74 79 70 65 64  the NFA */.typed
10c0: 65 66 20 75 6e 73 69 67 6e 65 64 20 73 68 6f 72  ef unsigned shor
10d0: 74 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72 3b  t ReStateNumber;
10e0: 0a 0a 2f 2a 20 42 65 63 61 75 73 65 20 74 68 69  ../* Because thi
10f0: 73 20 69 73 20 61 6e 20 4e 46 41 20 61 6e 64 20  s is an NFA and 
1100: 6e 6f 74 20 61 20 44 46 41 2c 20 6d 75 6c 74 69  not a DFA, multi
1110: 70 6c 65 20 73 74 61 74 65 73 20 63 61 6e 20 62  ple states can b
1120: 65 20 61 63 74 69 76 65 20 61 74 0a 2a 2a 20 6f  e active at.** o
1130: 6e 63 65 2e 20 20 41 6e 20 69 6e 73 74 61 6e 63  nce.  An instanc
1140: 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69  e of the followi
1150: 6e 67 20 6f 62 6a 65 63 74 20 72 65 63 6f 72 64  ng object record
1160: 73 20 61 6c 6c 20 61 63 74 69 76 65 20 73 74 61  s all active sta
1170: 74 65 73 20 69 6e 0a 2a 2a 20 74 68 65 20 4e 46  tes in.** the NF
1180: 41 2e 20 20 54 68 65 20 69 6d 70 6c 65 6d 65 6e  A.  The implemen
1190: 74 61 74 69 6f 6e 20 69 73 20 6f 70 74 69 6d 69  tation is optimi
11a0: 7a 65 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d  zed for the comm
11b0: 6f 6e 20 63 61 73 65 20 77 68 65 72 65 20 74 68  on case where th
11c0: 65 0a 2a 2a 20 6e 75 6d 62 65 72 20 6f 66 20 61  e.** number of a
11d0: 63 74 69 76 65 73 20 73 74 61 74 65 73 20 69 73  ctives states is
11e0: 20 73 6d 61 6c 6c 2e 0a 2a 2f 0a 74 79 70 65 64   small..*/.typed
11f0: 65 66 20 73 74 72 75 63 74 20 52 65 53 74 61 74  ef struct ReStat
1200: 65 53 65 74 20 7b 0a 20 20 75 6e 73 69 67 6e 65  eSet {.  unsigne
1210: 64 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20  d nState;       
1220: 20 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f       /* Number o
1230: 66 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 73  f current states
1240: 20 2a 2f 0a 20 20 52 65 53 74 61 74 65 4e 75 6d   */.  ReStateNum
1250: 62 65 72 20 2a 61 53 74 61 74 65 3b 20 20 20 20  ber *aState;    
1260: 20 20 2f 2a 20 43 75 72 72 65 6e 74 20 73 74 61    /* Current sta
1270: 74 65 73 20 2a 2f 0a 7d 20 52 65 53 74 61 74 65  tes */.} ReState
1280: 53 65 74 3b 0a 0a 2f 2a 20 41 6e 20 69 6e 70 75  Set;../* An inpu
1290: 74 20 73 74 72 69 6e 67 20 72 65 61 64 20 6f 6e  t string read on
12a0: 65 20 63 68 61 72 61 63 74 65 72 20 61 74 20 61  e character at a
12b0: 20 74 69 6d 65 2e 0a 2a 2f 0a 74 79 70 65 64 65   time..*/.typede
12c0: 66 20 73 74 72 75 63 74 20 52 65 49 6e 70 75 74  f struct ReInput
12d0: 20 52 65 49 6e 70 75 74 3b 0a 73 74 72 75 63 74   ReInput;.struct
12e0: 20 52 65 49 6e 70 75 74 20 7b 0a 20 20 63 6f 6e   ReInput {.  con
12f0: 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72  st unsigned char
1300: 20 2a 7a 3b 20 20 2f 2a 20 41 6c 6c 20 74 65 78   *z;  /* All tex
1310: 74 20 2a 2f 0a 20 20 69 6e 74 20 69 3b 20 20 20  t */.  int i;   
1320: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1330: 2f 2a 20 4e 65 78 74 20 62 79 74 65 20 74 6f 20  /* Next byte to 
1340: 72 65 61 64 20 2a 2f 0a 20 20 69 6e 74 20 6d 78  read */.  int mx
1350: 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;               
1360: 20 20 20 2f 2a 20 45 4f 46 20 77 68 65 6e 20 69     /* EOF when i
1370: 3e 3d 6d 78 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41  >=mx */.};../* A
1380: 20 63 6f 6d 70 69 6c 65 64 20 4e 46 41 20 28 6f   compiled NFA (o
1390: 72 20 61 6e 20 4e 46 41 20 74 68 61 74 20 69 73  r an NFA that is
13a0: 20 69 6e 20 74 68 65 20 70 72 6f 63 65 73 73 20   in the process 
13b0: 6f 66 20 62 65 69 6e 67 20 63 6f 6d 70 69 6c 65  of being compile
13c0: 64 29 20 69 73 0a 2a 2a 20 61 6e 20 69 6e 73 74  d) is.** an inst
13d0: 61 6e 63 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c  ance of the foll
13e0: 6f 77 69 6e 67 20 6f 62 6a 65 63 74 2e 0a 2a 2f  owing object..*/
13f0: 0a 74 79 70 65 64 65 66 20 73 74 72 75 63 74 20  .typedef struct 
1400: 52 65 43 6f 6d 70 69 6c 65 64 20 52 65 43 6f 6d  ReCompiled ReCom
1410: 70 69 6c 65 64 3b 0a 73 74 72 75 63 74 20 52 65  piled;.struct Re
1420: 43 6f 6d 70 69 6c 65 64 20 7b 0a 20 20 52 65 49  Compiled {.  ReI
1430: 6e 70 75 74 20 73 49 6e 3b 20 20 20 20 20 20 20  nput sIn;       
1440: 20 20 20 20 20 20 20 20 20 2f 2a 20 52 65 67 75           /* Regu
1450: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 74  lar expression t
1460: 65 78 74 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63  ext */.  const c
1470: 68 61 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20  har *zErr;      
1480: 20 20 20 20 20 2f 2a 20 45 72 72 6f 72 20 6d 65       /* Error me
1490: 73 73 61 67 65 20 74 6f 20 72 65 74 75 72 6e 20  ssage to return 
14a0: 2a 2f 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 20  */.  char *aOp; 
14b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
14c0: 20 2f 2a 20 4f 70 65 72 61 74 6f 72 73 20 66 6f   /* Operators fo
14d0: 72 20 74 68 65 20 76 69 72 74 75 61 6c 20 6d 61  r the virtual ma
14e0: 63 68 69 6e 65 20 2a 2f 0a 20 20 69 6e 74 20 2a  chine */.  int *
14f0: 61 41 72 67 3b 20 20 20 20 20 20 20 20 20 20 20  aArg;           
1500: 20 20 20 20 20 20 20 2f 2a 20 41 72 67 75 6d 65         /* Argume
1510: 6e 74 73 20 74 6f 20 65 61 63 68 20 6f 70 65 72  nts to each oper
1520: 61 74 6f 72 20 2a 2f 0a 20 20 75 6e 73 69 67 6e  ator */.  unsign
1530: 65 64 20 28 2a 78 4e 65 78 74 43 68 61 72 29 28  ed (*xNextChar)(
1540: 52 65 49 6e 70 75 74 2a 29 3b 20 20 2f 2a 20 4e  ReInput*);  /* N
1550: 65 78 74 20 63 68 61 72 61 63 74 65 72 20 66 75  ext character fu
1560: 6e 63 74 69 6f 6e 20 2a 2f 0a 20 20 75 6e 73 69  nction */.  unsi
1570: 67 6e 65 64 20 63 68 61 72 20 7a 49 6e 69 74 5b  gned char zInit[
1580: 31 32 5d 3b 20 20 20 20 2f 2a 20 49 6e 69 74 69  12];    /* Initi
1590: 61 6c 20 74 65 78 74 20 74 6f 20 6d 61 74 63 68  al text to match
15a0: 20 2a 2f 0a 20 20 69 6e 74 20 6e 49 6e 69 74 3b   */.  int nInit;
15b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
15c0: 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 63    /* Number of c
15d0: 68 61 72 61 63 74 65 72 73 20 69 6e 20 7a 49 6e  haracters in zIn
15e0: 69 74 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  it */.  unsigned
15f0: 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20 20   nState;        
1600: 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66      /* Number of
1610: 20 65 6e 74 72 69 65 73 20 69 6e 20 61 4f 70 5b   entries in aOp[
1620: 5d 20 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f 0a  ] and aArg[] */.
1630: 20 20 75 6e 73 69 67 6e 65 64 20 6e 41 6c 6c 6f    unsigned nAllo
1640: 63 3b 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a  c;            /*
1650: 20 53 6c 6f 74 73 20 61 6c 6c 6f 63 61 74 65 64   Slots allocated
1660: 20 66 6f 72 20 61 4f 70 5b 5d 20 61 6e 64 20 61   for aOp[] and a
1670: 41 72 67 5b 5d 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20  Arg[] */.};../* 
1680: 41 64 64 20 61 20 73 74 61 74 65 20 74 6f 20 74  Add a state to t
1690: 68 65 20 67 69 76 65 6e 20 73 74 61 74 65 20 73  he given state s
16a0: 65 74 20 69 66 20 69 74 20 69 73 20 6e 6f 74 20  et if it is not 
16b0: 61 6c 72 65 61 64 79 20 74 68 65 72 65 20 2a 2f  already there */
16c0: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f  .static void re_
16d0: 61 64 64 5f 73 74 61 74 65 28 52 65 53 74 61 74  add_state(ReStat
16e0: 65 53 65 74 20 2a 70 53 65 74 2c 20 69 6e 74 20  eSet *pSet, int 
16f0: 6e 65 77 53 74 61 74 65 29 7b 0a 20 20 75 6e 73  newState){.  uns
1700: 69 67 6e 65 64 20 69 3b 0a 20 20 66 6f 72 28 69  igned i;.  for(i
1710: 3d 30 3b 20 69 3c 70 53 65 74 2d 3e 6e 53 74 61  =0; i<pSet->nSta
1720: 74 65 3b 20 69 2b 2b 29 20 69 66 28 20 70 53 65  te; i++) if( pSe
1730: 74 2d 3e 61 53 74 61 74 65 5b 69 5d 3d 3d 6e 65  t->aState[i]==ne
1740: 77 53 74 61 74 65 20 29 20 72 65 74 75 72 6e 3b  wState ) return;
1750: 0a 20 20 70 53 65 74 2d 3e 61 53 74 61 74 65 5b  .  pSet->aState[
1760: 70 53 65 74 2d 3e 6e 53 74 61 74 65 2b 2b 5d 20  pSet->nState++] 
1770: 3d 20 28 52 65 53 74 61 74 65 4e 75 6d 62 65 72  = (ReStateNumber
1780: 29 6e 65 77 53 74 61 74 65 3b 0a 7d 0a 0a 2f 2a  )newState;.}../*
1790: 20 45 78 74 72 61 63 74 20 74 68 65 20 6e 65 78   Extract the nex
17a0: 74 20 75 6e 69 63 6f 64 65 20 63 68 61 72 61 63  t unicode charac
17b0: 74 65 72 20 66 72 6f 6d 20 2a 70 7a 49 6e 20 61  ter from *pzIn a
17c0: 6e 64 20 72 65 74 75 72 6e 20 69 74 2e 20 20 41  nd return it.  A
17d0: 64 76 61 6e 63 65 0a 2a 2a 20 2a 70 7a 49 6e 20  dvance.** *pzIn 
17e0: 74 6f 20 74 68 65 20 66 69 72 73 74 20 62 79 74  to the first byt
17f0: 65 20 70 61 73 74 20 74 68 65 20 65 6e 64 20 6f  e past the end o
1800: 66 20 74 68 65 20 63 68 61 72 61 63 74 65 72 20  f the character 
1810: 72 65 74 75 72 6e 65 64 2e 20 20 54 6f 0a 2a 2a  returned.  To.**
1820: 20 62 65 20 63 6c 65 61 72 3a 20 20 74 68 69 73   be clear:  this
1830: 20 72 6f 75 74 69 6e 65 20 63 6f 6e 76 65 72 74   routine convert
1840: 73 20 75 74 66 38 20 74 6f 20 75 6e 69 63 6f 64  s utf8 to unicod
1850: 65 2e 20 20 54 68 69 73 20 72 6f 75 74 69 6e 65  e.  This routine
1860: 20 69 73 20 0a 2a 2a 20 6f 70 74 69 6d 69 7a 65   is .** optimize
1870: 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f 6e  d for the common
1880: 20 63 61 73 65 20 77 68 65 72 65 20 74 68 65 20   case where the 
1890: 6e 65 78 74 20 63 68 61 72 61 63 74 65 72 20 69  next character i
18a0: 73 20 61 20 73 69 6e 67 6c 65 20 62 79 74 65 2e  s a single byte.
18b0: 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67  .*/.static unsig
18c0: 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68 61 72  ned re_next_char
18d0: 28 52 65 49 6e 70 75 74 20 2a 70 29 7b 0a 20 20  (ReInput *p){.  
18e0: 75 6e 73 69 67 6e 65 64 20 63 3b 0a 20 20 69 66  unsigned c;.  if
18f0: 28 20 70 2d 3e 69 3e 3d 70 2d 3e 6d 78 20 29 20  ( p->i>=p->mx ) 
1900: 72 65 74 75 72 6e 20 30 3b 0a 20 20 63 20 3d 20  return 0;.  c = 
1910: 70 2d 3e 7a 5b 70 2d 3e 69 2b 2b 5d 3b 0a 20 20  p->z[p->i++];.  
1920: 69 66 28 20 63 3e 3d 30 78 38 30 20 29 7b 0a 20  if( c>=0x80 ){. 
1930: 20 20 20 69 66 28 20 28 63 26 30 78 65 30 29 3d     if( (c&0xe0)=
1940: 3d 30 78 63 30 20 26 26 20 70 2d 3e 69 3c 70 2d  =0xc0 && p->i<p-
1950: 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e  >mx && (p->z[p->
1960: 69 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29  i]&0xc0)==0x80 )
1970: 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30  {.      c = (c&0
1980: 78 31 66 29 3c 3c 36 20 7c 20 28 70 2d 3e 7a 5b  x1f)<<6 | (p->z[
1990: 70 2d 3e 69 2b 2b 5d 26 30 78 33 66 29 3b 0a 20  p->i++]&0x3f);. 
19a0: 20 20 20 20 20 69 66 28 20 63 3c 30 78 38 30 20       if( c<0x80 
19b0: 29 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20  ) c = 0xfffd;.  
19c0: 20 20 7d 65 6c 73 65 20 69 66 28 20 28 63 26 30    }else if( (c&0
19d0: 78 66 30 29 3d 3d 30 78 65 30 20 26 26 20 70 2d  xf0)==0xe0 && p-
19e0: 3e 69 2b 31 3c 70 2d 3e 6d 78 20 26 26 20 28 70  >i+1<p->mx && (p
19f0: 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 63 30 29 3d  ->z[p->i]&0xc0)=
1a00: 3d 30 78 38 30 0a 20 20 20 20 20 20 20 20 20 20  =0x80.          
1a10: 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31   && (p->z[p->i+1
1a20: 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29 7b  ]&0xc0)==0x80 ){
1a30: 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30 78  .      c = (c&0x
1a40: 30 66 29 3c 3c 31 32 20 7c 20 28 28 70 2d 3e 7a  0f)<<12 | ((p->z
1a50: 5b 70 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 36 29  [p->i]&0x3f)<<6)
1a60: 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d   | (p->z[p->i+1]
1a70: 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 70 2d  &0x3f);.      p-
1a80: 3e 69 20 2b 3d 20 32 3b 0a 20 20 20 20 20 20 69  >i += 2;.      i
1a90: 66 28 20 63 3c 3d 30 78 33 66 66 20 7c 7c 20 28  f( c<=0x3ff || (
1aa0: 63 3e 3d 30 78 64 38 30 30 20 26 26 20 63 3c 3d  c>=0xd800 && c<=
1ab0: 30 78 64 66 66 66 29 20 29 20 63 20 3d 20 30 78  0xdfff) ) c = 0x
1ac0: 66 66 66 64 3b 0a 20 20 20 20 7d 65 6c 73 65 20  fffd;.    }else 
1ad0: 69 66 28 20 28 63 26 30 78 66 38 29 3d 3d 30 78  if( (c&0xf8)==0x
1ae0: 66 30 20 26 26 20 70 2d 3e 69 2b 33 3c 70 2d 3e  f0 && p->i+3<p->
1af0: 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69  mx && (p->z[p->i
1b00: 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 0a 20 20  ]&0xc0)==0x80.  
1b10: 20 20 20 20 20 20 20 20 20 26 26 20 28 70 2d 3e           && (p->
1b20: 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 63 30 29 3d  z[p->i+1]&0xc0)=
1b30: 3d 30 78 38 30 20 26 26 20 28 70 2d 3e 7a 5b 70  =0x80 && (p->z[p
1b40: 2d 3e 69 2b 32 5d 26 30 78 63 30 29 3d 3d 30 78  ->i+2]&0xc0)==0x
1b50: 38 30 20 29 7b 0a 20 20 20 20 20 20 63 20 3d 20  80 ){.      c = 
1b60: 28 63 26 30 78 30 37 29 3c 3c 31 38 20 7c 20 28  (c&0x07)<<18 | (
1b70: 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 33 66  (p->z[p->i]&0x3f
1b80: 29 3c 3c 31 32 29 20 7c 20 28 28 70 2d 3e 7a 5b  )<<12) | ((p->z[
1b90: 70 2d 3e 69 2b 31 5d 26 30 78 33 66 29 3c 3c 36  p->i+1]&0x3f)<<6
1ba0: 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ).              
1bb0: 20 20 20 20 20 20 20 20 20 7c 20 28 70 2d 3e 7a           | (p->z
1bc0: 5b 70 2d 3e 69 2b 32 5d 26 30 78 33 66 29 3b 0a  [p->i+2]&0x3f);.
1bd0: 20 20 20 20 20 20 70 2d 3e 69 20 2b 3d 20 33 3b        p->i += 3;
1be0: 0a 20 20 20 20 20 20 69 66 28 20 63 3c 3d 30 78  .      if( c<=0x
1bf0: 66 66 66 66 20 7c 7c 20 63 3e 30 78 31 30 66 66  ffff || c>0x10ff
1c00: 66 66 20 29 20 63 20 3d 20 30 78 66 66 66 64 3b  ff ) c = 0xfffd;
1c10: 0a 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20  .    }else{.    
1c20: 20 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20    c = 0xfffd;.  
1c30: 20 20 7d 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e    }.  }.  return
1c40: 20 63 3b 0a 7d 0a 73 74 61 74 69 63 20 75 6e 73   c;.}.static uns
1c50: 69 67 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68  igned re_next_ch
1c60: 61 72 5f 6e 6f 63 61 73 65 28 52 65 49 6e 70 75  ar_nocase(ReInpu
1c70: 74 20 2a 70 29 7b 0a 20 20 75 6e 73 69 67 6e 65  t *p){.  unsigne
1c80: 64 20 63 20 3d 20 72 65 5f 6e 65 78 74 5f 63 68  d c = re_next_ch
1c90: 61 72 28 70 29 3b 0a 20 20 69 66 28 20 63 3e 3d  ar(p);.  if( c>=
1ca0: 27 41 27 20 26 26 20 63 3c 3d 27 5a 27 20 29 20  'A' && c<='Z' ) 
1cb0: 63 20 2b 3d 20 27 61 27 20 2d 20 27 41 27 3b 0a  c += 'a' - 'A';.
1cc0: 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a 2f    return c;.}../
1cd0: 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20 69 66  * Return true if
1ce0: 20 63 20 69 73 20 61 20 70 65 72 6c 20 22 77 6f   c is a perl "wo
1cf0: 72 64 22 20 63 68 61 72 61 63 74 65 72 3a 20 20  rd" character:  
1d00: 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 20 2a 2f 0a  [A-Za-z0-9_] */.
1d10: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 77 6f  static int re_wo
1d20: 72 64 5f 63 68 61 72 28 69 6e 74 20 63 29 7b 0a  rd_char(int c){.
1d30: 20 20 72 65 74 75 72 6e 20 28 63 3e 3d 27 30 27    return (c>='0'
1d40: 20 26 26 20 63 3c 3d 27 39 27 29 20 7c 7c 20 28   && c<='9') || (
1d50: 63 3e 3d 27 61 27 20 26 26 20 63 3c 3d 27 7a 27  c>='a' && c<='z'
1d60: 29 0a 20 20 20 20 20 20 7c 7c 20 28 63 3e 3d 27  ).      || (c>='
1d70: 41 27 20 26 26 20 63 3c 3d 27 5a 27 29 20 7c 7c  A' && c<='Z') ||
1d80: 20 63 3d 3d 27 5f 27 3b 0a 7d 0a 0a 2f 2a 20 52   c=='_';.}../* R
1d90: 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63 20  eturn true if c 
1da0: 69 73 20 61 20 22 64 69 67 69 74 22 20 63 68 61  is a "digit" cha
1db0: 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 5d 20 2a  racter:  [0-9] *
1dc0: 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f  /.static int re_
1dd0: 64 69 67 69 74 5f 63 68 61 72 28 69 6e 74 20 63  digit_char(int c
1de0: 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 63 3e 3d  ){.  return (c>=
1df0: 27 30 27 20 26 26 20 63 3c 3d 27 39 27 29 3b 0a  '0' && c<='9');.
1e00: 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75  }../* Return tru
1e10: 65 20 69 66 20 63 20 69 73 20 61 20 70 65 72 6c  e if c is a perl
1e20: 20 22 73 70 61 63 65 22 20 63 68 61 72 61 63 74   "space" charact
1e30: 65 72 3a 20 20 5b 20 5c 74 5c 72 5c 6e 5c 76 5c  er:  [ \t\r\n\v\
1e40: 66 5d 20 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74  f] */.static int
1e50: 20 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28 69   re_space_char(i
1e60: 6e 74 20 63 29 7b 0a 20 20 72 65 74 75 72 6e 20  nt c){.  return 
1e70: 63 3d 3d 27 20 27 20 7c 7c 20 63 3d 3d 27 5c 74  c==' ' || c=='\t
1e80: 27 20 7c 7c 20 63 3d 3d 27 5c 6e 27 20 7c 7c 20  ' || c=='\n' || 
1e90: 63 3d 3d 27 5c 72 27 20 7c 7c 20 63 3d 3d 27 5c  c=='\r' || c=='\
1ea0: 76 27 20 7c 7c 20 63 3d 3d 27 5c 66 27 3b 0a 7d  v' || c=='\f';.}
1eb0: 0a 0a 2f 2a 20 52 75 6e 20 61 20 63 6f 6d 70 69  ../* Run a compi
1ec0: 6c 65 64 20 72 65 67 75 6c 61 72 20 65 78 70 72  led regular expr
1ed0: 65 73 73 69 6f 6e 20 6f 6e 20 74 68 65 20 7a 65  ession on the ze
1ee0: 72 6f 2d 74 65 72 6d 69 6e 61 74 65 64 20 69 6e  ro-terminated in
1ef0: 70 75 74 0a 2a 2a 20 73 74 72 69 6e 67 20 7a 49  put.** string zI
1f00: 6e 5b 5d 2e 20 20 52 65 74 75 72 6e 20 74 72 75  n[].  Return tru
1f10: 65 20 6f 6e 20 61 20 6d 61 74 63 68 20 61 6e 64  e on a match and
1f20: 20 66 61 6c 73 65 20 69 66 20 74 68 65 72 65 20   false if there 
1f30: 69 73 20 6e 6f 20 6d 61 74 63 68 2e 0a 2a 2f 0a  is no match..*/.
1f40: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 6d 61  static int re_ma
1f50: 74 63 68 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a  tch(ReCompiled *
1f60: 70 52 65 2c 20 63 6f 6e 73 74 20 75 6e 73 69 67  pRe, const unsig
1f70: 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69  ned char *zIn, i
1f80: 6e 74 20 6e 49 6e 29 7b 0a 20 20 52 65 53 74 61  nt nIn){.  ReSta
1f90: 74 65 53 65 74 20 61 53 74 61 74 65 53 65 74 5b  teSet aStateSet[
1fa0: 32 5d 2c 20 2a 70 54 68 69 73 2c 20 2a 70 4e 65  2], *pThis, *pNe
1fb0: 78 74 3b 0a 20 20 52 65 53 74 61 74 65 4e 75 6d  xt;.  ReStateNum
1fc0: 62 65 72 20 61 53 70 61 63 65 5b 31 30 30 5d 3b  ber aSpace[100];
1fd0: 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72  .  ReStateNumber
1fe0: 20 2a 70 54 6f 46 72 65 65 3b 0a 20 20 75 6e 73   *pToFree;.  uns
1ff0: 69 67 6e 65 64 20 69 6e 74 20 69 20 3d 20 30 3b  igned int i = 0;
2000: 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 20  .  unsigned int 
2010: 69 53 77 61 70 20 3d 20 30 3b 0a 20 20 69 6e 74  iSwap = 0;.  int
2020: 20 63 20 3d 20 52 45 5f 45 4f 46 2b 31 3b 0a 20   c = RE_EOF+1;. 
2030: 20 69 6e 74 20 63 50 72 65 76 20 3d 20 30 3b 0a   int cPrev = 0;.
2040: 20 20 69 6e 74 20 72 63 20 3d 20 30 3b 0a 20 20    int rc = 0;.  
2050: 52 65 49 6e 70 75 74 20 69 6e 3b 0a 0a 20 20 69  ReInput in;..  i
2060: 6e 2e 7a 20 3d 20 7a 49 6e 3b 0a 20 20 69 6e 2e  n.z = zIn;.  in.
2070: 69 20 3d 20 30 3b 0a 20 20 69 6e 2e 6d 78 20 3d  i = 0;.  in.mx =
2080: 20 6e 49 6e 3e 3d 30 20 3f 20 6e 49 6e 20 3a 20   nIn>=0 ? nIn : 
2090: 28 69 6e 74 29 73 74 72 6c 65 6e 28 28 63 68 61  (int)strlen((cha
20a0: 72 20 63 6f 6e 73 74 2a 29 7a 49 6e 29 3b 0a 0a  r const*)zIn);..
20b0: 20 20 2f 2a 20 4c 6f 6f 6b 20 66 6f 72 20 74 68    /* Look for th
20c0: 65 20 69 6e 69 74 69 61 6c 20 70 72 65 66 69 78  e initial prefix
20d0: 20 6d 61 74 63 68 2c 20 69 66 20 74 68 65 72 65   match, if there
20e0: 20 69 73 20 6f 6e 65 2e 20 2a 2f 0a 20 20 69 66   is one. */.  if
20f0: 28 20 70 52 65 2d 3e 6e 49 6e 69 74 20 29 7b 0a  ( pRe->nInit ){.
2100: 20 20 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61      unsigned cha
2110: 72 20 78 20 3d 20 70 52 65 2d 3e 7a 49 6e 69 74  r x = pRe->zInit
2120: 5b 30 5d 3b 0a 20 20 20 20 77 68 69 6c 65 28 20  [0];.    while( 
2130: 69 6e 2e 69 2b 70 52 65 2d 3e 6e 49 6e 69 74 3c  in.i+pRe->nInit<
2140: 3d 69 6e 2e 6d 78 20 0a 20 20 20 20 20 26 26 20  =in.mx .     && 
2150: 28 7a 49 6e 5b 69 6e 2e 69 5d 21 3d 78 20 7c 7c  (zIn[in.i]!=x ||
2160: 0a 20 20 20 20 20 20 20 20 20 73 74 72 6e 63 6d  .         strncm
2170: 70 28 28 63 6f 6e 73 74 20 63 68 61 72 2a 29 7a  p((const char*)z
2180: 49 6e 2b 69 6e 2e 69 2c 20 28 63 6f 6e 73 74 20  In+in.i, (const 
2190: 63 68 61 72 2a 29 70 52 65 2d 3e 7a 49 6e 69 74  char*)pRe->zInit
21a0: 2c 20 70 52 65 2d 3e 6e 49 6e 69 74 29 21 3d 30  , pRe->nInit)!=0
21b0: 29 0a 20 20 20 20 29 7b 0a 20 20 20 20 20 20 69  ).    ){.      i
21c0: 6e 2e 69 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20 20  n.i++;.    }.   
21d0: 20 69 66 28 20 69 6e 2e 69 2b 70 52 65 2d 3e 6e   if( in.i+pRe->n
21e0: 49 6e 69 74 3e 69 6e 2e 6d 78 20 29 20 72 65 74  Init>in.mx ) ret
21f0: 75 72 6e 20 30 3b 0a 20 20 7d 0a 0a 20 20 69 66  urn 0;.  }..  if
2200: 28 20 70 52 65 2d 3e 6e 53 74 61 74 65 3c 3d 28  ( pRe->nState<=(
2210: 73 69 7a 65 6f 66 28 61 53 70 61 63 65 29 2f 28  sizeof(aSpace)/(
2220: 73 69 7a 65 6f 66 28 61 53 70 61 63 65 5b 30 5d  sizeof(aSpace[0]
2230: 29 2a 32 29 29 20 29 7b 0a 20 20 20 20 70 54 6f  )*2)) ){.    pTo
2240: 46 72 65 65 20 3d 20 30 3b 0a 20 20 20 20 61 53  Free = 0;.    aS
2250: 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74 61 74  tateSet[0].aStat
2260: 65 20 3d 20 61 53 70 61 63 65 3b 0a 20 20 7d 65  e = aSpace;.  }e
2270: 6c 73 65 7b 0a 20 20 20 20 70 54 6f 46 72 65 65  lse{.    pToFree
2280: 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61 6c 6c 6f   = sqlite3_mallo
2290: 63 28 20 73 69 7a 65 6f 66 28 52 65 53 74 61 74  c( sizeof(ReStat
22a0: 65 4e 75 6d 62 65 72 29 2a 32 2a 70 52 65 2d 3e  eNumber)*2*pRe->
22b0: 6e 53 74 61 74 65 20 29 3b 0a 20 20 20 20 69 66  nState );.    if
22c0: 28 20 70 54 6f 46 72 65 65 3d 3d 30 20 29 20 72  ( pToFree==0 ) r
22d0: 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 61 53  eturn -1;.    aS
22e0: 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74 61 74  tateSet[0].aStat
22f0: 65 20 3d 20 70 54 6f 46 72 65 65 3b 0a 20 20 7d  e = pToFree;.  }
2300: 0a 20 20 61 53 74 61 74 65 53 65 74 5b 31 5d 2e  .  aStateSet[1].
2310: 61 53 74 61 74 65 20 3d 20 26 61 53 74 61 74 65  aState = &aState
2320: 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 5b 70 52  Set[0].aState[pR
2330: 65 2d 3e 6e 53 74 61 74 65 5d 3b 0a 20 20 70 4e  e->nState];.  pN
2340: 65 78 74 20 3d 20 26 61 53 74 61 74 65 53 65 74  ext = &aStateSet
2350: 5b 31 5d 3b 0a 20 20 70 4e 65 78 74 2d 3e 6e 53  [1];.  pNext->nS
2360: 74 61 74 65 20 3d 20 30 3b 0a 20 20 72 65 5f 61  tate = 0;.  re_a
2370: 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20  dd_state(pNext, 
2380: 30 29 3b 0a 20 20 77 68 69 6c 65 28 20 63 21 3d  0);.  while( c!=
2390: 52 45 5f 45 4f 46 20 26 26 20 70 4e 65 78 74 2d  RE_EOF && pNext-
23a0: 3e 6e 53 74 61 74 65 3e 30 20 29 7b 0a 20 20 20  >nState>0 ){.   
23b0: 20 63 50 72 65 76 20 3d 20 63 3b 0a 20 20 20 20   cPrev = c;.    
23c0: 63 20 3d 20 70 52 65 2d 3e 78 4e 65 78 74 43 68  c = pRe->xNextCh
23d0: 61 72 28 26 69 6e 29 3b 0a 20 20 20 20 70 54 68  ar(&in);.    pTh
23e0: 69 73 20 3d 20 70 4e 65 78 74 3b 0a 20 20 20 20  is = pNext;.    
23f0: 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74 65 53  pNext = &aStateS
2400: 65 74 5b 69 53 77 61 70 5d 3b 0a 20 20 20 20 69  et[iSwap];.    i
2410: 53 77 61 70 20 3d 20 31 20 2d 20 69 53 77 61 70  Swap = 1 - iSwap
2420: 3b 0a 20 20 20 20 70 4e 65 78 74 2d 3e 6e 53 74  ;.    pNext->nSt
2430: 61 74 65 20 3d 20 30 3b 0a 20 20 20 20 66 6f 72  ate = 0;.    for
2440: 28 69 3d 30 3b 20 69 3c 70 54 68 69 73 2d 3e 6e  (i=0; i<pThis->n
2450: 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20  State; i++){.   
2460: 20 20 20 69 6e 74 20 78 20 3d 20 70 54 68 69 73     int x = pThis
2470: 2d 3e 61 53 74 61 74 65 5b 69 5d 3b 0a 20 20 20  ->aState[i];.   
2480: 20 20 20 73 77 69 74 63 68 28 20 70 52 65 2d 3e     switch( pRe->
2490: 61 4f 70 5b 78 5d 20 29 7b 0a 20 20 20 20 20 20  aOp[x] ){.      
24a0: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4d 41 54    case RE_OP_MAT
24b0: 43 48 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  CH: {.          
24c0: 69 66 28 20 70 52 65 2d 3e 61 41 72 67 5b 78 5d  if( pRe->aArg[x]
24d0: 3d 3d 63 20 29 20 72 65 5f 61 64 64 5f 73 74 61  ==c ) re_add_sta
24e0: 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a  te(pNext, x+1);.
24f0: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
2500: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
2510: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 41 4e     case RE_OP_AN
2520: 59 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 72  Y: {.          r
2530: 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78  e_add_state(pNex
2540: 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20  t, x+1);.       
2550: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
2560: 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65    }.        case
2570: 20 52 45 5f 4f 50 5f 57 4f 52 44 3a 20 7b 0a 20   RE_OP_WORD: {. 
2580: 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65 5f           if( re_
2590: 77 6f 72 64 5f 63 68 61 72 28 63 29 20 29 20 72  word_char(c) ) r
25a0: 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78  e_add_state(pNex
25b0: 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20  t, x+1);.       
25c0: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
25d0: 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65    }.        case
25e0: 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3a 20   RE_OP_NOTWORD: 
25f0: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  {.          if( 
2600: 21 72 65 5f 77 6f 72 64 5f 63 68 61 72 28 63 29  !re_word_char(c)
2610: 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28   ) re_add_state(
2620: 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20  pNext, x+1);.   
2630: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
2640: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2650: 63 61 73 65 20 52 45 5f 4f 50 5f 44 49 47 49 54  case RE_OP_DIGIT
2660: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66  : {.          if
2670: 28 20 72 65 5f 64 69 67 69 74 5f 63 68 61 72 28  ( re_digit_char(
2680: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
2690: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
26a0: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
26b0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
26c0: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e 4f 54    case RE_OP_NOT
26d0: 44 49 47 49 54 3a 20 7b 0a 20 20 20 20 20 20 20  DIGIT: {.       
26e0: 20 20 20 69 66 28 20 21 72 65 5f 64 69 67 69 74     if( !re_digit
26f0: 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f 61 64  _char(c) ) re_ad
2700: 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78  d_state(pNext, x
2710: 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  +1);.          b
2720: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
2730: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
2740: 4f 50 5f 53 50 41 43 45 3a 20 7b 0a 20 20 20 20  OP_SPACE: {.    
2750: 20 20 20 20 20 20 69 66 28 20 72 65 5f 73 70 61        if( re_spa
2760: 63 65 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f  ce_char(c) ) re_
2770: 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c  add_state(pNext,
2780: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
2790: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
27a0: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
27b0: 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3a 20 7b  E_OP_NOTSPACE: {
27c0: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 21  .          if( !
27d0: 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28 63 29  re_space_char(c)
27e0: 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28   ) re_add_state(
27f0: 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20  pNext, x+1);.   
2800: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
2810: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2820: 63 61 73 65 20 52 45 5f 4f 50 5f 42 4f 55 4e 44  case RE_OP_BOUND
2830: 41 52 59 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  ARY: {.         
2840: 20 69 66 28 20 72 65 5f 77 6f 72 64 5f 63 68 61   if( re_word_cha
2850: 72 28 63 29 21 3d 72 65 5f 77 6f 72 64 5f 63 68  r(c)!=re_word_ch
2860: 61 72 28 63 50 72 65 76 29 20 29 20 72 65 5f 61  ar(cPrev) ) re_a
2870: 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c 20  dd_state(pThis, 
2880: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
2890: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
28a0: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
28b0: 5f 4f 50 5f 41 4e 59 53 54 41 52 3a 20 7b 0a 20  _OP_ANYSTAR: {. 
28c0: 20 20 20 20 20 20 20 20 20 72 65 5f 61 64 64 5f           re_add_
28d0: 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78 29 3b  state(pNext, x);
28e0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 64  .          re_ad
28f0: 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c 20 78  d_state(pThis, x
2900: 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  +1);.          b
2910: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
2920: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
2930: 4f 50 5f 46 4f 52 4b 3a 20 7b 0a 20 20 20 20 20  OP_FORK: {.     
2940: 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61 74       re_add_stat
2950: 65 28 70 54 68 69 73 2c 20 78 2b 70 52 65 2d 3e  e(pThis, x+pRe->
2960: 61 41 72 67 5b 78 5d 29 3b 0a 20 20 20 20 20 20  aArg[x]);.      
2970: 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61 74 65      re_add_state
2980: 28 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a 20 20  (pThis, x+1);.  
2990: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
29a0: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
29b0: 20 63 61 73 65 20 52 45 5f 4f 50 5f 47 4f 54 4f   case RE_OP_GOTO
29c0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65  : {.          re
29d0: 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73  _add_state(pThis
29e0: 2c 20 78 2b 70 52 65 2d 3e 61 41 72 67 5b 78 5d  , x+pRe->aArg[x]
29f0: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65  );.          bre
2a00: 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20  ak;.        }.  
2a10: 20 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50        case RE_OP
2a20: 5f 41 43 43 45 50 54 3a 20 7b 0a 20 20 20 20 20  _ACCEPT: {.     
2a30: 20 20 20 20 20 72 63 20 3d 20 31 3b 0a 20 20 20       rc = 1;.   
2a40: 20 20 20 20 20 20 20 67 6f 74 6f 20 72 65 5f 6d         goto re_m
2a50: 61 74 63 68 5f 65 6e 64 3b 0a 20 20 20 20 20 20  atch_end;.      
2a60: 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65    }.        case
2a70: 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 3a 0a 20   RE_OP_CC_INC:. 
2a80: 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f         case RE_O
2a90: 50 5f 43 43 5f 45 58 43 3a 20 7b 0a 20 20 20 20  P_CC_EXC: {.    
2aa0: 20 20 20 20 20 20 69 6e 74 20 6a 20 3d 20 31 3b        int j = 1;
2ab0: 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74 20 6e  .          int n
2ac0: 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b 78 5d 3b   = pRe->aArg[x];
2ad0: 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74 20 68  .          int h
2ae0: 69 74 20 3d 20 30 3b 0a 20 20 20 20 20 20 20 20  it = 0;.        
2af0: 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3e 30 20 26    for(j=1; j>0 &
2b00: 26 20 6a 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20 20 20  & j<n; j++){.   
2b10: 20 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65           if( pRe
2b20: 2d 3e 61 4f 70 5b 78 2b 6a 5d 3d 3d 52 45 5f 4f  ->aOp[x+j]==RE_O
2b30: 50 5f 43 43 5f 56 41 4c 55 45 20 29 7b 0a 20 20  P_CC_VALUE ){.  
2b40: 20 20 20 20 20 20 20 20 20 20 20 20 69 66 28 20              if( 
2b50: 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 5d 3d 3d  pRe->aArg[x+j]==
2b60: 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 20  c ){.           
2b70: 20 20 20 20 20 68 69 74 20 3d 20 31 3b 0a 20 20       hit = 1;.  
2b80: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 6a 20                j 
2b90: 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 20 20  = -1;.          
2ba0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20      }.          
2bb0: 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20    }else{.       
2bc0: 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d 3e         if( pRe->
2bd0: 61 41 72 67 5b 78 2b 6a 5d 3c 3d 63 20 26 26 20  aArg[x+j]<=c && 
2be0: 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 2b 31 5d  pRe->aArg[x+j+1]
2bf0: 3e 3d 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20  >=c ){.         
2c00: 20 20 20 20 20 20 20 68 69 74 20 3d 20 31 3b 0a         hit = 1;.
2c10: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2c20: 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20 20  j = -1;.        
2c30: 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20        }else{.   
2c40: 20 20 20 20 20 20 20 20 20 20 20 20 20 6a 2b 2b               j++
2c50: 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;.              
2c60: 7d 0a 20 20 20 20 20 20 20 20 20 20 20 20 7d 0a  }.            }.
2c70: 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20            }.    
2c80: 20 20 20 20 20 20 69 66 28 20 70 52 65 2d 3e 61        if( pRe->a
2c90: 4f 70 5b 78 5d 3d 3d 52 45 5f 4f 50 5f 43 43 5f  Op[x]==RE_OP_CC_
2ca0: 45 58 43 20 29 20 68 69 74 20 3d 20 21 68 69 74  EXC ) hit = !hit
2cb0: 3b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  ;.          if( 
2cc0: 68 69 74 20 29 20 72 65 5f 61 64 64 5f 73 74 61  hit ) re_add_sta
2cd0: 74 65 28 70 4e 65 78 74 2c 20 78 2b 6e 29 3b 0a  te(pNext, x+n);.
2ce0: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
2cf0: 20 20 20 20 20 20 20 20 20 20 20 20 0a 20 20 20              .   
2d00: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 7d 0a 20       }.      }. 
2d10: 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72 28 69     }.  }.  for(i
2d20: 3d 30 3b 20 69 3c 70 4e 65 78 74 2d 3e 6e 53 74  =0; i<pNext->nSt
2d30: 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 69  ate; i++){.    i
2d40: 66 28 20 70 52 65 2d 3e 61 4f 70 5b 70 4e 65 78  f( pRe->aOp[pNex
2d50: 74 2d 3e 61 53 74 61 74 65 5b 69 5d 5d 3d 3d 52  t->aState[i]]==R
2d60: 45 5f 4f 50 5f 41 43 43 45 50 54 20 29 7b 20 72  E_OP_ACCEPT ){ r
2d70: 63 20 3d 20 31 3b 20 62 72 65 61 6b 3b 20 7d 0a  c = 1; break; }.
2d80: 20 20 7d 0a 72 65 5f 6d 61 74 63 68 5f 65 6e 64    }.re_match_end
2d90: 3a 0a 20 20 73 71 6c 69 74 65 33 5f 66 72 65 65  :.  sqlite3_free
2da0: 28 70 54 6f 46 72 65 65 29 3b 0a 20 20 72 65 74  (pToFree);.  ret
2db0: 75 72 6e 20 72 63 3b 0a 7d 0a 0a 2f 2a 20 52 65  urn rc;.}../* Re
2dc0: 73 69 7a 65 20 74 68 65 20 6f 70 63 6f 64 65 20  size the opcode 
2dd0: 61 6e 64 20 61 72 67 75 6d 65 6e 74 20 61 72 72  and argument arr
2de0: 61 79 73 20 66 6f 72 20 61 6e 20 52 45 20 75 6e  ays for an RE un
2df0: 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e  der construction
2e00: 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20  ..*/.static int 
2e10: 72 65 5f 72 65 73 69 7a 65 28 52 65 43 6f 6d 70  re_resize(ReComp
2e20: 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 4e 29 7b  iled *p, int N){
2e30: 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 0a 20 20  .  char *aOp;.  
2e40: 69 6e 74 20 2a 61 41 72 67 3b 0a 20 20 61 4f 70  int *aArg;.  aOp
2e50: 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61 6c 6c   = sqlite3_reall
2e60: 6f 63 28 70 2d 3e 61 4f 70 2c 20 4e 2a 73 69 7a  oc(p->aOp, N*siz
2e70: 65 6f 66 28 70 2d 3e 61 4f 70 5b 30 5d 29 29 3b  eof(p->aOp[0]));
2e80: 0a 20 20 69 66 28 20 61 4f 70 3d 3d 30 20 29 20  .  if( aOp==0 ) 
2e90: 72 65 74 75 72 6e 20 31 3b 0a 20 20 70 2d 3e 61  return 1;.  p->a
2ea0: 4f 70 20 3d 20 61 4f 70 3b 0a 20 20 61 41 72 67  Op = aOp;.  aArg
2eb0: 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61 6c 6c   = sqlite3_reall
2ec0: 6f 63 28 70 2d 3e 61 41 72 67 2c 20 4e 2a 73 69  oc(p->aArg, N*si
2ed0: 7a 65 6f 66 28 70 2d 3e 61 41 72 67 5b 30 5d 29  zeof(p->aArg[0])
2ee0: 29 3b 0a 20 20 69 66 28 20 61 41 72 67 3d 3d 30  );.  if( aArg==0
2ef0: 20 29 20 72 65 74 75 72 6e 20 31 3b 0a 20 20 70   ) return 1;.  p
2f00: 2d 3e 61 41 72 67 20 3d 20 61 41 72 67 3b 0a 20  ->aArg = aArg;. 
2f10: 20 70 2d 3e 6e 41 6c 6c 6f 63 20 3d 20 4e 3b 0a   p->nAlloc = N;.
2f20: 20 20 72 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f    return 0;.}../
2f30: 2a 20 49 6e 73 65 72 74 20 61 20 6e 65 77 20 6f  * Insert a new o
2f40: 70 63 6f 64 65 20 61 6e 64 20 61 72 67 75 6d 65  pcode and argume
2f50: 6e 74 20 69 6e 74 6f 20 61 6e 20 52 45 20 75 6e  nt into an RE un
2f60: 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e  der construction
2f70: 2e 20 20 54 68 65 0a 2a 2a 20 69 6e 73 65 72 74  .  The.** insert
2f80: 69 6f 6e 20 70 6f 69 6e 74 20 69 73 20 6a 75 73  ion point is jus
2f90: 74 20 70 72 69 6f 72 20 74 6f 20 65 78 69 73 74  t prior to exist
2fa0: 69 6e 67 20 6f 70 63 6f 64 65 20 69 42 65 66 6f  ing opcode iBefo
2fb0: 72 65 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e  re..*/.static in
2fc0: 74 20 72 65 5f 69 6e 73 65 72 74 28 52 65 43 6f  t re_insert(ReCo
2fd0: 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 69  mpiled *p, int i
2fe0: 42 65 66 6f 72 65 2c 20 69 6e 74 20 6f 70 2c 20  Before, int op, 
2ff0: 69 6e 74 20 61 72 67 29 7b 0a 20 20 69 6e 74 20  int arg){.  int 
3000: 69 3b 0a 20 20 69 66 28 20 70 2d 3e 6e 41 6c 6c  i;.  if( p->nAll
3010: 6f 63 3c 3d 70 2d 3e 6e 53 74 61 74 65 20 26 26  oc<=p->nState &&
3020: 20 72 65 5f 72 65 73 69 7a 65 28 70 2c 20 70 2d   re_resize(p, p-
3030: 3e 6e 41 6c 6c 6f 63 2a 32 29 20 29 20 72 65 74  >nAlloc*2) ) ret
3040: 75 72 6e 20 30 3b 0a 20 20 66 6f 72 28 69 3d 70  urn 0;.  for(i=p
3050: 2d 3e 6e 53 74 61 74 65 3b 20 69 3e 69 42 65 66  ->nState; i>iBef
3060: 6f 72 65 3b 20 69 2d 2d 29 7b 0a 20 20 20 20 70  ore; i--){.    p
3070: 2d 3e 61 4f 70 5b 69 5d 20 3d 20 70 2d 3e 61 4f  ->aOp[i] = p->aO
3080: 70 5b 69 2d 31 5d 3b 0a 20 20 20 20 70 2d 3e 61  p[i-1];.    p->a
3090: 41 72 67 5b 69 5d 20 3d 20 70 2d 3e 61 41 72 67  Arg[i] = p->aArg
30a0: 5b 69 2d 31 5d 3b 0a 20 20 7d 0a 20 20 70 2d 3e  [i-1];.  }.  p->
30b0: 6e 53 74 61 74 65 2b 2b 3b 0a 20 20 70 2d 3e 61  nState++;.  p->a
30c0: 4f 70 5b 69 42 65 66 6f 72 65 5d 20 3d 20 28 63  Op[iBefore] = (c
30d0: 68 61 72 29 6f 70 3b 0a 20 20 70 2d 3e 61 41 72  har)op;.  p->aAr
30e0: 67 5b 69 42 65 66 6f 72 65 5d 20 3d 20 61 72 67  g[iBefore] = arg
30f0: 3b 0a 20 20 72 65 74 75 72 6e 20 69 42 65 66 6f  ;.  return iBefo
3100: 72 65 3b 0a 7d 0a 0a 2f 2a 20 41 70 70 65 6e 64  re;.}../* Append
3110: 20 61 20 6e 65 77 20 6f 70 63 6f 64 65 20 61 6e   a new opcode an
3120: 64 20 61 72 67 75 6d 65 6e 74 20 74 6f 20 74 68  d argument to th
3130: 65 20 65 6e 64 20 6f 66 20 74 68 65 20 52 45 20  e end of the RE 
3140: 75 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69  under constructi
3150: 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e  on..*/.static in
3160: 74 20 72 65 5f 61 70 70 65 6e 64 28 52 65 43 6f  t re_append(ReCo
3170: 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 6f  mpiled *p, int o
3180: 70 2c 20 69 6e 74 20 61 72 67 29 7b 0a 20 20 72  p, int arg){.  r
3190: 65 74 75 72 6e 20 72 65 5f 69 6e 73 65 72 74 28  eturn re_insert(
31a0: 70 2c 20 70 2d 3e 6e 53 74 61 74 65 2c 20 6f 70  p, p->nState, op
31b0: 2c 20 61 72 67 29 3b 0a 7d 0a 0a 2f 2a 20 4d 61  , arg);.}../* Ma
31c0: 6b 65 20 61 20 63 6f 70 79 20 6f 66 20 4e 20 6f  ke a copy of N o
31d0: 70 63 6f 64 65 73 20 73 74 61 72 74 69 6e 67 20  pcodes starting 
31e0: 61 74 20 69 53 74 61 72 74 20 6f 6e 74 6f 20 74  at iStart onto t
31f0: 68 65 20 65 6e 64 20 6f 66 20 74 68 65 20 52 45  he end of the RE
3200: 0a 2a 2a 20 75 6e 64 65 72 20 63 6f 6e 73 74 72  .** under constr
3210: 75 63 74 69 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69  uction..*/.stati
3220: 63 20 76 6f 69 64 20 72 65 5f 63 6f 70 79 28 52  c void re_copy(R
3230: 65 43 6f 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e  eCompiled *p, in
3240: 74 20 69 53 74 61 72 74 2c 20 69 6e 74 20 4e 29  t iStart, int N)
3250: 7b 0a 20 20 69 66 28 20 70 2d 3e 6e 53 74 61 74  {.  if( p->nStat
3260: 65 2b 4e 3e 3d 70 2d 3e 6e 41 6c 6c 6f 63 20 26  e+N>=p->nAlloc &
3270: 26 20 72 65 5f 72 65 73 69 7a 65 28 70 2c 20 70  & re_resize(p, p
3280: 2d 3e 6e 41 6c 6c 6f 63 2a 32 2b 4e 29 20 29 20  ->nAlloc*2+N) ) 
3290: 72 65 74 75 72 6e 3b 0a 20 20 6d 65 6d 63 70 79  return;.  memcpy
32a0: 28 26 70 2d 3e 61 4f 70 5b 70 2d 3e 6e 53 74 61  (&p->aOp[p->nSta
32b0: 74 65 5d 2c 20 26 70 2d 3e 61 4f 70 5b 69 53 74  te], &p->aOp[iSt
32c0: 61 72 74 5d 2c 20 4e 2a 73 69 7a 65 6f 66 28 70  art], N*sizeof(p
32d0: 2d 3e 61 4f 70 5b 30 5d 29 29 3b 0a 20 20 6d 65  ->aOp[0]));.  me
32e0: 6d 63 70 79 28 26 70 2d 3e 61 41 72 67 5b 70 2d  mcpy(&p->aArg[p-
32f0: 3e 6e 53 74 61 74 65 5d 2c 20 26 70 2d 3e 61 41  >nState], &p->aA
3300: 72 67 5b 69 53 74 61 72 74 5d 2c 20 4e 2a 73 69  rg[iStart], N*si
3310: 7a 65 6f 66 28 70 2d 3e 61 41 72 67 5b 30 5d 29  zeof(p->aArg[0])
3320: 29 3b 0a 20 20 70 2d 3e 6e 53 74 61 74 65 20 2b  );.  p->nState +
3330: 3d 20 4e 3b 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72  = N;.}../* Retur
3340: 6e 20 74 72 75 65 20 69 66 20 63 20 69 73 20 61  n true if c is a
3350: 20 68 65 78 61 64 65 63 69 6d 61 6c 20 64 69 67   hexadecimal dig
3360: 69 74 20 63 68 61 72 61 63 74 65 72 3a 20 20 5b  it character:  [
3370: 30 2d 39 61 2d 66 41 2d 46 5d 0a 2a 2a 20 49 66  0-9a-fA-F].** If
3380: 20 63 20 69 73 20 61 20 68 65 78 20 64 69 67 69   c is a hex digi
3390: 74 2c 20 61 6c 73 6f 20 73 65 74 20 2a 70 56 20  t, also set *pV 
33a0: 3d 20 28 2a 70 56 29 2a 31 36 20 2b 20 76 61 6c  = (*pV)*16 + val
33b0: 75 65 6f 66 28 63 29 2e 20 20 49 66 0a 2a 2a 20  ueof(c).  If.** 
33c0: 63 20 69 73 20 6e 6f 74 20 61 20 68 65 78 20 64  c is not a hex d
33d0: 69 67 69 74 20 2a 70 56 20 69 73 20 75 6e 63 68  igit *pV is unch
33e0: 61 6e 67 65 64 2e 0a 2a 2f 0a 73 74 61 74 69 63  anged..*/.static
33f0: 20 69 6e 74 20 72 65 5f 68 65 78 28 69 6e 74 20   int re_hex(int 
3400: 63 2c 20 69 6e 74 20 2a 70 56 29 7b 0a 20 20 69  c, int *pV){.  i
3410: 66 28 20 63 3e 3d 27 30 27 20 26 26 20 63 3c 3d  f( c>='0' && c<=
3420: 27 39 27 20 29 7b 0a 20 20 20 20 63 20 2d 3d 20  '9' ){.    c -= 
3430: 27 30 27 3b 0a 20 20 7d 65 6c 73 65 20 69 66 28  '0';.  }else if(
3440: 20 63 3e 3d 27 61 27 20 26 26 20 63 3c 3d 27 66   c>='a' && c<='f
3450: 27 20 29 7b 0a 20 20 20 20 63 20 2d 3d 20 27 61  ' ){.    c -= 'a
3460: 27 20 2d 20 31 30 3b 0a 20 20 7d 65 6c 73 65 20  ' - 10;.  }else 
3470: 69 66 28 20 63 3e 3d 27 41 27 20 26 26 20 63 3c  if( c>='A' && c<
3480: 3d 27 46 27 20 29 7b 0a 20 20 20 20 63 20 2d 3d  ='F' ){.    c -=
3490: 20 27 41 27 20 2d 20 31 30 3b 0a 20 20 7d 65 6c   'A' - 10;.  }el
34a0: 73 65 7b 0a 20 20 20 20 72 65 74 75 72 6e 20 30  se{.    return 0
34b0: 3b 0a 20 20 7d 0a 20 20 2a 70 56 20 3d 20 28 2a  ;.  }.  *pV = (*
34c0: 70 56 29 2a 31 36 20 2b 20 28 63 20 26 20 30 78  pV)*16 + (c & 0x
34d0: 66 66 29 3b 0a 20 20 72 65 74 75 72 6e 20 31 3b  ff);.  return 1;
34e0: 0a 7d 0a 0a 2f 2a 20 41 20 62 61 63 6b 73 6c 61  .}../* A backsla
34f0: 73 68 20 63 68 61 72 61 63 74 65 72 20 68 61 73  sh character has
3500: 20 62 65 65 6e 20 73 65 65 6e 2c 20 72 65 61 64   been seen, read
3510: 20 74 68 65 20 6e 65 78 74 20 63 68 61 72 61 63   the next charac
3520: 74 65 72 20 61 6e 64 0a 2a 2a 20 72 65 74 75 72  ter and.** retur
3530: 6e 20 69 74 73 20 69 6e 74 65 72 70 72 65 74 61  n its interpreta
3540: 74 69 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20  tion..*/.static 
3550: 75 6e 73 69 67 6e 65 64 20 72 65 5f 65 73 63 5f  unsigned re_esc_
3560: 63 68 61 72 28 52 65 43 6f 6d 70 69 6c 65 64 20  char(ReCompiled 
3570: 2a 70 29 7b 0a 20 20 73 74 61 74 69 63 20 63 6f  *p){.  static co
3580: 6e 73 74 20 63 68 61 72 20 7a 45 73 63 5b 5d 20  nst char zEsc[] 
3590: 3d 20 22 61 66 6e 72 74 76 5c 5c 28 29 2a 2e 2b  = "afnrtv\\()*.+
35a0: 3f 5b 24 5e 7b 7c 7d 5d 22 3b 0a 20 20 73 74 61  ?[$^{|}]";.  sta
35b0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 7a  tic const char z
35c0: 54 72 61 6e 73 5b 5d 20 3d 20 22 5c 61 5c 66 5c  Trans[] = "\a\f\
35d0: 6e 5c 72 5c 74 5c 76 22 3b 0a 20 20 69 6e 74 20  n\r\t\v";.  int 
35e0: 69 2c 20 76 20 3d 20 30 3b 0a 20 20 63 68 61 72  i, v = 0;.  char
35f0: 20 63 3b 0a 20 20 69 66 28 20 70 2d 3e 73 49 6e   c;.  if( p->sIn
3600: 2e 69 3e 3d 70 2d 3e 73 49 6e 2e 6d 78 20 29 20  .i>=p->sIn.mx ) 
3610: 72 65 74 75 72 6e 20 30 3b 0a 20 20 63 20 3d 20  return 0;.  c = 
3620: 70 2d 3e 73 49 6e 2e 7a 5b 70 2d 3e 73 49 6e 2e  p->sIn.z[p->sIn.
3630: 69 5d 3b 0a 20 20 69 66 28 20 63 3d 3d 27 75 27  i];.  if( c=='u'
3640: 20 26 26 20 70 2d 3e 73 49 6e 2e 69 2b 34 3c 70   && p->sIn.i+4<p
3650: 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20 20  ->sIn.mx ){.    
3660: 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63  const unsigned c
3670: 68 61 72 20 2a 7a 49 6e 20 3d 20 70 2d 3e 73 49  har *zIn = p->sI
3680: 6e 2e 7a 20 2b 20 70 2d 3e 73 49 6e 2e 69 3b 0a  n.z + p->sIn.i;.
3690: 20 20 20 20 69 66 28 20 72 65 5f 68 65 78 28 7a      if( re_hex(z
36a0: 49 6e 5b 31 5d 2c 26 76 29 0a 20 20 20 20 20 26  In[1],&v).     &
36b0: 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 32 5d 2c  & re_hex(zIn[2],
36c0: 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f 68  &v).     && re_h
36d0: 65 78 28 7a 49 6e 5b 33 5d 2c 26 76 29 0a 20 20  ex(zIn[3],&v).  
36e0: 20 20 20 26 26 20 72 65 5f 68 65 78 28 7a 49 6e     && re_hex(zIn
36f0: 5b 34 5d 2c 26 76 29 0a 20 20 20 20 29 7b 0a 20  [4],&v).    ){. 
3700: 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 20 2b 3d       p->sIn.i +=
3710: 20 35 3b 0a 20 20 20 20 20 20 72 65 74 75 72 6e   5;.      return
3720: 20 76 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20   v;.    }.  }.  
3730: 69 66 28 20 63 3d 3d 27 78 27 20 26 26 20 70 2d  if( c=='x' && p-
3740: 3e 73 49 6e 2e 69 2b 32 3c 70 2d 3e 73 49 6e 2e  >sIn.i+2<p->sIn.
3750: 6d 78 20 29 7b 0a 20 20 20 20 63 6f 6e 73 74 20  mx ){.    const 
3760: 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a  unsigned char *z
3770: 49 6e 20 3d 20 70 2d 3e 73 49 6e 2e 7a 20 2b 20  In = p->sIn.z + 
3780: 70 2d 3e 73 49 6e 2e 69 3b 0a 20 20 20 20 69 66  p->sIn.i;.    if
3790: 28 20 72 65 5f 68 65 78 28 7a 49 6e 5b 31 5d 2c  ( re_hex(zIn[1],
37a0: 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f 68  &v).     && re_h
37b0: 65 78 28 7a 49 6e 5b 32 5d 2c 26 76 29 0a 20 20  ex(zIn[2],&v).  
37c0: 20 20 29 7b 0a 20 20 20 20 20 20 70 2d 3e 73 49    ){.      p->sI
37d0: 6e 2e 69 20 2b 3d 20 33 3b 0a 20 20 20 20 20 20  n.i += 3;.      
37e0: 72 65 74 75 72 6e 20 76 3b 0a 20 20 20 20 7d 0a  return v;.    }.
37f0: 20 20 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 7a    }.  for(i=0; z
3800: 45 73 63 5b 69 5d 20 26 26 20 7a 45 73 63 5b 69  Esc[i] && zEsc[i
3810: 5d 21 3d 63 3b 20 69 2b 2b 29 7b 7d 0a 20 20 69  ]!=c; i++){}.  i
3820: 66 28 20 7a 45 73 63 5b 69 5d 20 29 7b 0a 20 20  f( zEsc[i] ){.  
3830: 20 20 69 66 28 20 69 3c 36 20 29 20 63 20 3d 20    if( i<6 ) c = 
3840: 7a 54 72 61 6e 73 5b 69 5d 3b 0a 20 20 20 20 70  zTrans[i];.    p
3850: 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 7d 65 6c  ->sIn.i++;.  }el
3860: 73 65 7b 0a 20 20 20 20 70 2d 3e 7a 45 72 72 20  se{.    p->zErr 
3870: 3d 20 22 75 6e 6b 6e 6f 77 6e 20 5c 5c 20 65 73  = "unknown \\ es
3880: 63 61 70 65 22 3b 0a 20 20 7d 0a 20 20 72 65 74  cape";.  }.  ret
3890: 75 72 6e 20 63 3b 0a 7d 0a 0a 2f 2a 20 46 6f 72  urn c;.}../* For
38a0: 77 61 72 64 20 64 65 63 6c 61 72 61 74 69 6f 6e  ward declaration
38b0: 20 2a 2f 0a 73 74 61 74 69 63 20 63 6f 6e 73 74   */.static const
38c0: 20 63 68 61 72 20 2a 72 65 5f 73 75 62 63 6f 6d   char *re_subcom
38d0: 70 69 6c 65 5f 73 74 72 69 6e 67 28 52 65 43 6f  pile_string(ReCo
38e0: 6d 70 69 6c 65 64 2a 29 3b 0a 0a 2f 2a 20 50 65  mpiled*);../* Pe
38f0: 65 6b 20 61 74 20 74 68 65 20 6e 65 78 74 20 62  ek at the next b
3900: 79 74 65 20 6f 66 20 69 6e 70 75 74 20 2a 2f 0a  yte of input */.
3910: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20  static unsigned 
3920: 63 68 61 72 20 72 65 50 65 65 6b 28 52 65 43 6f  char rePeek(ReCo
3930: 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 72 65  mpiled *p){.  re
3940: 74 75 72 6e 20 70 2d 3e 73 49 6e 2e 69 3c 70 2d  turn p->sIn.i<p-
3950: 3e 73 49 6e 2e 6d 78 20 3f 20 70 2d 3e 73 49 6e  >sIn.mx ? p->sIn
3960: 2e 7a 5b 70 2d 3e 73 49 6e 2e 69 5d 20 3a 20 30  .z[p->sIn.i] : 0
3970: 3b 0a 7d 0a 0a 2f 2a 20 43 6f 6d 70 69 6c 65 20  ;.}../* Compile 
3980: 52 45 20 74 65 78 74 20 69 6e 74 6f 20 61 20 73  RE text into a s
3990: 65 71 75 65 6e 63 65 20 6f 66 20 6f 70 63 6f 64  equence of opcod
39a0: 65 73 2e 20 20 43 6f 6e 74 69 6e 75 65 20 75 70  es.  Continue up
39b0: 20 74 6f 20 74 68 65 0a 2a 2a 20 66 69 72 73 74   to the.** first
39c0: 20 75 6e 6d 61 74 63 68 65 64 20 22 29 22 20 63   unmatched ")" c
39d0: 68 61 72 61 63 74 65 72 2c 20 74 68 65 6e 20 72  haracter, then r
39e0: 65 74 75 72 6e 2e 20 20 49 66 20 61 6e 20 65 72  eturn.  If an er
39f0: 72 6f 72 20 69 73 20 66 6f 75 6e 64 2c 0a 2a 2a  ror is found,.**
3a00: 20 72 65 74 75 72 6e 20 61 20 70 6f 69 6e 74 65   return a pointe
3a10: 72 20 74 6f 20 74 68 65 20 65 72 72 6f 72 20 6d  r to the error m
3a20: 65 73 73 61 67 65 20 73 74 72 69 6e 67 2e 0a 2a  essage string..*
3a30: 2f 0a 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63  /.static const c
3a40: 68 61 72 20 2a 72 65 5f 73 75 62 63 6f 6d 70 69  har *re_subcompi
3a50: 6c 65 5f 72 65 28 52 65 43 6f 6d 70 69 6c 65 64  le_re(ReCompiled
3a60: 20 2a 70 29 7b 0a 20 20 63 6f 6e 73 74 20 63 68   *p){.  const ch
3a70: 61 72 20 2a 7a 45 72 72 3b 0a 20 20 69 6e 74 20  ar *zErr;.  int 
3a80: 69 53 74 61 72 74 2c 20 69 45 6e 64 2c 20 69 47  iStart, iEnd, iG
3a90: 6f 74 6f 3b 0a 20 20 69 53 74 61 72 74 20 3d 20  oto;.  iStart = 
3aa0: 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 7a 45 72  p->nState;.  zEr
3ab0: 72 20 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69 6c  r = re_subcompil
3ac0: 65 5f 73 74 72 69 6e 67 28 70 29 3b 0a 20 20 69  e_string(p);.  i
3ad0: 66 28 20 7a 45 72 72 20 29 20 72 65 74 75 72 6e  f( zErr ) return
3ae0: 20 7a 45 72 72 3b 0a 20 20 77 68 69 6c 65 28 20   zErr;.  while( 
3af0: 72 65 50 65 65 6b 28 70 29 3d 3d 27 7c 27 20 29  rePeek(p)=='|' )
3b00: 7b 0a 20 20 20 20 69 45 6e 64 20 3d 20 70 2d 3e  {.    iEnd = p->
3b10: 6e 53 74 61 74 65 3b 0a 20 20 20 20 72 65 5f 69  nState;.    re_i
3b20: 6e 73 65 72 74 28 70 2c 20 69 53 74 61 72 74 2c  nsert(p, iStart,
3b30: 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 69 45 6e   RE_OP_FORK, iEn
3b40: 64 20 2b 20 32 20 2d 20 69 53 74 61 72 74 29 3b  d + 2 - iStart);
3b50: 0a 20 20 20 20 69 47 6f 74 6f 20 3d 20 72 65 5f  .    iGoto = re_
3b60: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
3b70: 47 4f 54 4f 2c 20 30 29 3b 0a 20 20 20 20 70 2d  GOTO, 0);.    p-
3b80: 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 7a 45  >sIn.i++;.    zE
3b90: 72 72 20 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69  rr = re_subcompi
3ba0: 6c 65 5f 73 74 72 69 6e 67 28 70 29 3b 0a 20 20  le_string(p);.  
3bb0: 20 20 69 66 28 20 7a 45 72 72 20 29 20 72 65 74    if( zErr ) ret
3bc0: 75 72 6e 20 7a 45 72 72 3b 0a 20 20 20 20 70 2d  urn zErr;.    p-
3bd0: 3e 61 41 72 67 5b 69 47 6f 74 6f 5d 20 3d 20 70  >aArg[iGoto] = p
3be0: 2d 3e 6e 53 74 61 74 65 20 2d 20 69 47 6f 74 6f  ->nState - iGoto
3bf0: 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 30  ;.  }.  return 0
3c00: 3b 0a 7d 0a 0a 2f 2a 20 43 6f 6d 70 69 6c 65 20  ;.}../* Compile 
3c10: 61 6e 20 65 6c 65 6d 65 6e 74 20 6f 66 20 72 65  an element of re
3c20: 67 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e  gular expression
3c30: 20 74 65 78 74 20 28 61 6e 79 74 68 69 6e 67 20   text (anything 
3c40: 74 68 61 74 20 63 61 6e 20 62 65 0a 2a 2a 20 61  that can be.** a
3c50: 6e 20 6f 70 65 72 61 6e 64 20 74 6f 20 74 68 65  n operand to the
3c60: 20 22 7c 22 20 6f 70 65 72 61 74 6f 72 29 2e 20   "|" operator). 
3c70: 20 52 65 74 75 72 6e 20 4e 55 4c 4c 20 6f 6e 20   Return NULL on 
3c80: 73 75 63 63 65 73 73 20 6f 72 20 61 20 70 6f 69  success or a poi
3c90: 6e 74 65 72 0a 2a 2a 20 74 6f 20 74 68 65 20 65  nter.** to the e
3ca0: 72 72 6f 72 20 6d 65 73 73 61 67 65 20 69 66 20  rror message if 
3cb0: 74 68 65 72 65 20 69 73 20 61 20 70 72 6f 62 6c  there is a probl
3cc0: 65 6d 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 63 6f  em..*/.static co
3cd0: 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 73 75 62  nst char *re_sub
3ce0: 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28 52  compile_string(R
3cf0: 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20  eCompiled *p){. 
3d00: 20 69 6e 74 20 69 50 72 65 76 20 3d 20 2d 31 3b   int iPrev = -1;
3d10: 0a 20 20 69 6e 74 20 69 53 74 61 72 74 3b 0a 20  .  int iStart;. 
3d20: 20 75 6e 73 69 67 6e 65 64 20 63 3b 0a 20 20 63   unsigned c;.  c
3d30: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b  onst char *zErr;
3d40: 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 70  .  while( (c = p
3d50: 2d 3e 78 4e 65 78 74 43 68 61 72 28 26 70 2d 3e  ->xNextChar(&p->
3d60: 73 49 6e 29 29 21 3d 30 20 29 7b 0a 20 20 20 20  sIn))!=0 ){.    
3d70: 69 53 74 61 72 74 20 3d 20 70 2d 3e 6e 53 74 61  iStart = p->nSta
3d80: 74 65 3b 0a 20 20 20 20 73 77 69 74 63 68 28 20  te;.    switch( 
3d90: 63 20 29 7b 0a 20 20 20 20 20 20 63 61 73 65 20  c ){.      case 
3da0: 27 7c 27 3a 0a 20 20 20 20 20 20 63 61 73 65 20  '|':.      case 
3db0: 27 24 27 3a 20 0a 20 20 20 20 20 20 63 61 73 65  '$': .      case
3dc0: 20 27 29 27 3a 20 7b 0a 20 20 20 20 20 20 20 20   ')': {.        
3dd0: 70 2d 3e 73 49 6e 2e 69 2d 2d 3b 0a 20 20 20 20  p->sIn.i--;.    
3de0: 20 20 20 20 72 65 74 75 72 6e 20 30 3b 0a 20 20      return 0;.  
3df0: 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65      }.      case
3e00: 20 27 28 27 3a 20 7b 0a 20 20 20 20 20 20 20 20   '(': {.        
3e10: 7a 45 72 72 20 3d 20 72 65 5f 73 75 62 63 6f 6d  zErr = re_subcom
3e20: 70 69 6c 65 5f 72 65 28 70 29 3b 0a 20 20 20 20  pile_re(p);.    
3e30: 20 20 20 20 69 66 28 20 7a 45 72 72 20 29 20 72      if( zErr ) r
3e40: 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20 20 20  eturn zErr;.    
3e50: 20 20 20 20 69 66 28 20 72 65 50 65 65 6b 28 70      if( rePeek(p
3e60: 29 21 3d 27 29 27 20 29 20 72 65 74 75 72 6e 20  )!=')' ) return 
3e70: 22 75 6e 6d 61 74 63 68 65 64 20 27 28 27 22 3b  "unmatched '('";
3e80: 0a 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e  .        p->sIn.
3e90: 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 62 72 65  i++;.        bre
3ea0: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  ak;.      }.    
3eb0: 20 20 63 61 73 65 20 27 2e 27 3a 20 7b 0a 20 20    case '.': {.  
3ec0: 20 20 20 20 20 20 69 66 28 20 72 65 50 65 65 6b        if( rePeek
3ed0: 28 70 29 3d 3d 27 2a 27 20 29 7b 0a 20 20 20 20  (p)=='*' ){.    
3ee0: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
3ef0: 70 2c 20 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52  p, RE_OP_ANYSTAR
3f00: 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 20 20  , 0);.          
3f10: 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20  p->sIn.i++;.    
3f20: 20 20 20 20 7d 65 6c 73 65 7b 20 0a 20 20 20 20      }else{ .    
3f30: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
3f40: 70 2c 20 52 45 5f 4f 50 5f 41 4e 59 2c 20 30 29  p, RE_OP_ANY, 0)
3f50: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
3f60: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
3f70: 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 2a   }.      case '*
3f80: 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28  ': {.        if(
3f90: 20 69 50 72 65 76 3c 30 20 29 20 72 65 74 75 72   iPrev<0 ) retur
3fa0: 6e 20 22 27 2a 27 20 77 69 74 68 6f 75 74 20 6f  n "'*' without o
3fb0: 70 65 72 61 6e 64 22 3b 0a 20 20 20 20 20 20 20  perand";.       
3fc0: 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 50   re_insert(p, iP
3fd0: 72 65 76 2c 20 52 45 5f 4f 50 5f 47 4f 54 4f 2c  rev, RE_OP_GOTO,
3fe0: 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20 69 50 72   p->nState - iPr
3ff0: 65 76 20 2b 20 31 29 3b 0a 20 20 20 20 20 20 20  ev + 1);.       
4000: 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45   re_append(p, RE
4010: 5f 4f 50 5f 46 4f 52 4b 2c 20 69 50 72 65 76 20  _OP_FORK, iPrev 
4020: 2d 20 70 2d 3e 6e 53 74 61 74 65 20 2b 20 31 29  - p->nState + 1)
4030: 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b  ;.        break;
4040: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63  .      }.      c
4050: 61 73 65 20 27 2b 27 3a 20 7b 0a 20 20 20 20 20  ase '+': {.     
4060: 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20 29     if( iPrev<0 )
4070: 20 72 65 74 75 72 6e 20 22 27 2b 27 20 77 69 74   return "'+' wit
4080: 68 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a 20  hout operand";. 
4090: 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64         re_append
40a0: 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20  (p, RE_OP_FORK, 
40b0: 69 50 72 65 76 20 2d 20 70 2d 3e 6e 53 74 61 74  iPrev - p->nStat
40c0: 65 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61  e);.        brea
40d0: 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20  k;.      }.     
40e0: 20 63 61 73 65 20 27 3f 27 3a 20 7b 0a 20 20 20   case '?': {.   
40f0: 20 20 20 20 20 69 66 28 20 69 50 72 65 76 3c 30       if( iPrev<0
4100: 20 29 20 72 65 74 75 72 6e 20 22 27 3f 27 20 77   ) return "'?' w
4110: 69 74 68 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b  ithout operand";
4120: 0a 20 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65  .        re_inse
4130: 72 74 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f  rt(p, iPrev, RE_
4140: 4f 50 5f 46 4f 52 4b 2c 20 70 2d 3e 6e 53 74 61  OP_FORK, p->nSta
4150: 74 65 20 2d 20 69 50 72 65 76 2b 31 29 3b 0a 20  te - iPrev+1);. 
4160: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
4170: 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65      }.      case
4180: 20 27 7b 27 3a 20 7b 0a 20 20 20 20 20 20 20 20   '{': {.        
4190: 69 6e 74 20 6d 20 3d 20 30 2c 20 6e 20 3d 20 30  int m = 0, n = 0
41a0: 3b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 73 7a  ;.        int sz
41b0: 2c 20 6a 3b 0a 20 20 20 20 20 20 20 20 69 66 28  , j;.        if(
41c0: 20 69 50 72 65 76 3c 30 20 29 20 72 65 74 75 72   iPrev<0 ) retur
41d0: 6e 20 22 27 7b 6d 2c 6e 7d 27 20 77 69 74 68 6f  n "'{m,n}' witho
41e0: 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a 20 20 20  ut operand";.   
41f0: 20 20 20 20 20 77 68 69 6c 65 28 20 28 63 3d 72       while( (c=r
4200: 65 50 65 65 6b 28 70 29 29 3e 3d 27 30 27 20 26  ePeek(p))>='0' &
4210: 26 20 63 3c 3d 27 39 27 20 29 7b 20 6d 20 3d 20  & c<='9' ){ m = 
4220: 6d 2a 31 30 20 2b 20 63 20 2d 20 27 30 27 3b 20  m*10 + c - '0'; 
4230: 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 7d 0a 20 20  p->sIn.i++; }.  
4240: 20 20 20 20 20 20 6e 20 3d 20 6d 3b 0a 20 20 20        n = m;.   
4250: 20 20 20 20 20 69 66 28 20 63 3d 3d 27 2c 27 20       if( c==',' 
4260: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 70 2d 3e  ){.          p->
4270: 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20  sIn.i++;.       
4280: 20 20 20 6e 20 3d 20 30 3b 0a 20 20 20 20 20 20     n = 0;.      
4290: 20 20 20 20 77 68 69 6c 65 28 20 28 63 3d 72 65      while( (c=re
42a0: 50 65 65 6b 28 70 29 29 3e 3d 27 30 27 20 26 26  Peek(p))>='0' &&
42b0: 20 63 3c 3d 27 39 27 20 29 7b 20 6e 20 3d 20 6e   c<='9' ){ n = n
42c0: 2a 31 30 20 2b 20 63 2d 27 30 27 3b 20 70 2d 3e  *10 + c-'0'; p->
42d0: 73 49 6e 2e 69 2b 2b 3b 20 7d 0a 20 20 20 20 20  sIn.i++; }.     
42e0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28     }.        if(
42f0: 20 63 21 3d 27 7d 27 20 29 20 72 65 74 75 72 6e   c!='}' ) return
4300: 20 22 75 6e 6d 61 74 63 68 65 64 20 27 7b 27 22   "unmatched '{'"
4310: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 6e 3e  ;.        if( n>
4320: 30 20 26 26 20 6e 3c 6d 20 29 20 72 65 74 75 72  0 && n<m ) retur
4330: 6e 20 22 6e 20 6c 65 73 73 20 74 68 61 6e 20 6d  n "n less than m
4340: 20 69 6e 20 27 7b 6d 2c 6e 7d 27 22 3b 0a 20 20   in '{m,n}'";.  
4350: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b        p->sIn.i++
4360: 3b 0a 20 20 20 20 20 20 20 20 73 7a 20 3d 20 70  ;.        sz = p
4370: 2d 3e 6e 53 74 61 74 65 20 2d 20 69 50 72 65 76  ->nState - iPrev
4380: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 6d 3d  ;.        if( m=
4390: 3d 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  =0 ){.          
43a0: 69 66 28 20 6e 3d 3d 30 20 29 20 72 65 74 75 72  if( n==0 ) retur
43b0: 6e 20 22 62 6f 74 68 20 6d 20 61 6e 64 20 6e 20  n "both m and n 
43c0: 61 72 65 20 7a 65 72 6f 20 69 6e 20 27 7b 6d 2c  are zero in '{m,
43d0: 6e 7d 27 22 3b 0a 20 20 20 20 20 20 20 20 20 20  n}'";.          
43e0: 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 50 72  re_insert(p, iPr
43f0: 65 76 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20  ev, RE_OP_FORK, 
4400: 73 7a 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20  sz+1);.         
4410: 20 6e 2d 2d 3b 0a 20 20 20 20 20 20 20 20 7d 65   n--;.        }e
4420: 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20 66  lse{.          f
4430: 6f 72 28 6a 3d 31 3b 20 6a 3c 6d 3b 20 6a 2b 2b  or(j=1; j<m; j++
4440: 29 20 72 65 5f 63 6f 70 79 28 70 2c 20 69 50 72  ) re_copy(p, iPr
4450: 65 76 2c 20 73 7a 29 3b 0a 20 20 20 20 20 20 20  ev, sz);.       
4460: 20 7d 0a 20 20 20 20 20 20 20 20 66 6f 72 28 6a   }.        for(j
4470: 3d 6d 3b 20 6a 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20  =m; j<n; j++){. 
4480: 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65           re_appe
4490: 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b  nd(p, RE_OP_FORK
44a0: 2c 20 73 7a 2b 31 29 3b 0a 20 20 20 20 20 20 20  , sz+1);.       
44b0: 20 20 20 72 65 5f 63 6f 70 79 28 70 2c 20 69 50     re_copy(p, iP
44c0: 72 65 76 2c 20 73 7a 29 3b 0a 20 20 20 20 20 20  rev, sz);.      
44d0: 20 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20    }.        if( 
44e0: 6e 3d 3d 30 20 26 26 20 6d 3e 30 20 29 7b 0a 20  n==0 && m>0 ){. 
44f0: 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65           re_appe
4500: 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b  nd(p, RE_OP_FORK
4510: 2c 20 2d 73 7a 29 3b 0a 20 20 20 20 20 20 20 20  , -sz);.        
4520: 7d 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b  }.        break;
4530: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63  .      }.      c
4540: 61 73 65 20 27 5b 27 3a 20 7b 0a 20 20 20 20 20  ase '[': {.     
4550: 20 20 20 69 6e 74 20 69 46 69 72 73 74 20 3d 20     int iFirst = 
4560: 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 20 20 20  p->nState;.     
4570: 20 20 20 69 66 28 20 72 65 50 65 65 6b 28 70 29     if( rePeek(p)
4580: 3d 3d 27 5e 27 20 29 7b 0a 20 20 20 20 20 20 20  =='^' ){.       
4590: 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20     re_append(p, 
45a0: 52 45 5f 4f 50 5f 43 43 5f 45 58 43 2c 20 30 29  RE_OP_CC_EXC, 0)
45b0: 3b 0a 20 20 20 20 20 20 20 20 20 20 70 2d 3e 73  ;.          p->s
45c0: 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20  In.i++;.        
45d0: 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20  }else{.         
45e0: 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45   re_append(p, RE
45f0: 5f 4f 50 5f 43 43 5f 49 4e 43 2c 20 30 29 3b 0a  _OP_CC_INC, 0);.
4600: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
4610: 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 70 2d    while( (c = p-
4620: 3e 78 4e 65 78 74 43 68 61 72 28 26 70 2d 3e 73  >xNextChar(&p->s
4630: 49 6e 29 29 21 3d 30 20 29 7b 0a 20 20 20 20 20  In))!=0 ){.     
4640: 20 20 20 20 20 69 66 28 20 63 3d 3d 27 5b 27 20       if( c=='[' 
4650: 26 26 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 3a  && rePeek(p)==':
4660: 27 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 20  ' ){.           
4670: 20 72 65 74 75 72 6e 20 22 50 4f 53 49 58 20 63   return "POSIX c
4680: 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 65 73  haracter classes
4690: 20 6e 6f 74 20 73 75 70 70 6f 72 74 65 64 22 3b   not supported";
46a0: 0a 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20 20  .          }.   
46b0: 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 27 5c         if( c=='\
46c0: 5c 27 20 29 20 63 20 3d 20 72 65 5f 65 73 63 5f  \' ) c = re_esc_
46d0: 63 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20 20  char(p);.       
46e0: 20 20 20 69 66 28 20 72 65 50 65 65 6b 28 70 29     if( rePeek(p)
46f0: 3d 3d 27 2d 27 20 29 7b 0a 20 20 20 20 20 20 20  =='-' ){.       
4700: 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70       re_append(p
4710: 2c 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45  , RE_OP_CC_RANGE
4720: 2c 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20  , c);.          
4730: 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20    p->sIn.i++;.  
4740: 20 20 20 20 20 20 20 20 20 20 63 20 3d 20 70 2d            c = p-
4750: 3e 78 4e 65 78 74 43 68 61 72 28 26 70 2d 3e 73  >xNextChar(&p->s
4760: 49 6e 29 3b 0a 20 20 20 20 20 20 20 20 20 20 20  In);.           
4770: 20 69 66 28 20 63 3d 3d 27 5c 5c 27 20 29 20 63   if( c=='\\' ) c
4780: 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72 28 70   = re_esc_char(p
4790: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 72  );.            r
47a0: 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f  e_append(p, RE_O
47b0: 50 5f 43 43 5f 52 41 4e 47 45 2c 20 63 29 3b 0a  P_CC_RANGE, c);.
47c0: 20 20 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b            }else{
47d0: 0a 20 20 20 20 20 20 20 20 20 20 20 20 72 65 5f  .            re_
47e0: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
47f0: 43 43 5f 56 41 4c 55 45 2c 20 63 29 3b 0a 20 20  CC_VALUE, c);.  
4800: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
4810: 20 20 20 20 69 66 28 20 72 65 50 65 65 6b 28 70      if( rePeek(p
4820: 29 3d 3d 27 5d 27 20 29 7b 20 70 2d 3e 73 49 6e  )==']' ){ p->sIn
4830: 2e 69 2b 2b 3b 20 62 72 65 61 6b 3b 20 7d 0a 20  .i++; break; }. 
4840: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
4850: 20 69 66 28 20 63 3d 3d 30 20 29 20 72 65 74 75   if( c==0 ) retu
4860: 72 6e 20 22 75 6e 63 6c 6f 73 65 64 20 27 5b 27  rn "unclosed '['
4870: 22 3b 0a 20 20 20 20 20 20 20 20 70 2d 3e 61 41  ";.        p->aA
4880: 72 67 5b 69 46 69 72 73 74 5d 20 3d 20 70 2d 3e  rg[iFirst] = p->
4890: 6e 53 74 61 74 65 20 2d 20 69 46 69 72 73 74 3b  nState - iFirst;
48a0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  .        break;.
48b0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61        }.      ca
48c0: 73 65 20 27 5c 5c 27 3a 20 7b 0a 20 20 20 20 20  se '\\': {.     
48d0: 20 20 20 69 6e 74 20 73 70 65 63 69 61 6c 4f 70     int specialOp
48e0: 20 3d 20 30 3b 0a 20 20 20 20 20 20 20 20 73 77   = 0;.        sw
48f0: 69 74 63 68 28 20 72 65 50 65 65 6b 28 70 29 20  itch( rePeek(p) 
4900: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73  ){.          cas
4910: 65 20 27 62 27 3a 20 73 70 65 63 69 61 6c 4f 70  e 'b': specialOp
4920: 20 3d 20 52 45 5f 4f 50 5f 42 4f 55 4e 44 41 52   = RE_OP_BOUNDAR
4930: 59 3b 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20  Y;   break;.    
4940: 20 20 20 20 20 20 63 61 73 65 20 27 64 27 3a 20        case 'd': 
4950: 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f  specialOp = RE_O
4960: 50 5f 44 49 47 49 54 3b 20 20 20 20 20 20 62 72  P_DIGIT;      br
4970: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63  eak;.          c
4980: 61 73 65 20 27 44 27 3a 20 73 70 65 63 69 61 6c  ase 'D': special
4990: 4f 70 20 3d 20 52 45 5f 4f 50 5f 4e 4f 54 44 49  Op = RE_OP_NOTDI
49a0: 47 49 54 3b 20 20 20 62 72 65 61 6b 3b 0a 20 20  GIT;   break;.  
49b0: 20 20 20 20 20 20 20 20 63 61 73 65 20 27 73 27          case 's'
49c0: 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45  : specialOp = RE
49d0: 5f 4f 50 5f 53 50 41 43 45 3b 20 20 20 20 20 20  _OP_SPACE;      
49e0: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20  break;.         
49f0: 20 63 61 73 65 20 27 53 27 3a 20 73 70 65 63 69   case 'S': speci
4a00: 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 4e 4f 54  alOp = RE_OP_NOT
4a10: 53 50 41 43 45 3b 20 20 20 62 72 65 61 6b 3b 0a  SPACE;   break;.
4a20: 20 20 20 20 20 20 20 20 20 20 63 61 73 65 20 27            case '
4a30: 77 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20  w': specialOp = 
4a40: 52 45 5f 4f 50 5f 57 4f 52 44 3b 20 20 20 20 20  RE_OP_WORD;     
4a50: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
4a60: 20 20 20 63 61 73 65 20 27 57 27 3a 20 73 70 65     case 'W': spe
4a70: 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 4e  cialOp = RE_OP_N
4a80: 4f 54 57 4f 52 44 3b 20 20 20 20 62 72 65 61 6b  OTWORD;    break
4a90: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
4aa0: 20 20 20 20 69 66 28 20 73 70 65 63 69 61 6c 4f      if( specialO
4ab0: 70 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 70  p ){.          p
4ac0: 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20  ->sIn.i++;.     
4ad0: 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70       re_append(p
4ae0: 2c 20 73 70 65 63 69 61 6c 4f 70 2c 20 30 29 3b  , specialOp, 0);
4af0: 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a  .        }else{.
4b00: 20 20 20 20 20 20 20 20 20 20 63 20 3d 20 72 65            c = re
4b10: 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a 20 20  _esc_char(p);.  
4b20: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
4b30: 64 28 70 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48  d(p, RE_OP_MATCH
4b40: 2c 20 63 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a  , c);.        }.
4b50: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
4b60: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 64 65 66       }.      def
4b70: 61 75 6c 74 3a 20 7b 0a 20 20 20 20 20 20 20 20  ault: {.        
4b80: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
4b90: 4f 50 5f 4d 41 54 43 48 2c 20 63 29 3b 0a 20 20  OP_MATCH, c);.  
4ba0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20        break;.   
4bb0: 20 20 20 7d 0a 20 20 20 20 7d 0a 20 20 20 20 69     }.    }.    i
4bc0: 50 72 65 76 20 3d 20 69 53 74 61 72 74 3b 0a 20  Prev = iStart;. 
4bd0: 20 7d 0a 20 20 72 65 74 75 72 6e 20 30 3b 0a 7d   }.  return 0;.}
4be0: 0a 0a 2f 2a 20 46 72 65 65 20 61 6e 64 20 72 65  ../* Free and re
4bf0: 63 6c 61 69 6d 20 61 6c 6c 20 74 68 65 20 6d 65  claim all the me
4c00: 6d 6f 72 79 20 75 73 65 64 20 62 79 20 61 20 70  mory used by a p
4c10: 72 65 76 69 6f 75 73 6c 79 20 63 6f 6d 70 69 6c  reviously compil
4c20: 65 64 0a 2a 2a 20 72 65 67 75 6c 61 72 20 65 78  ed.** regular ex
4c30: 70 72 65 73 73 69 6f 6e 2e 20 20 41 70 70 6c 69  pression.  Appli
4c40: 63 61 74 69 6f 6e 73 20 73 68 6f 75 6c 64 20 69  cations should i
4c50: 6e 76 6f 6b 65 20 74 68 69 73 20 72 6f 75 74 69  nvoke this routi
4c60: 6e 65 20 6f 6e 63 65 0a 2a 2a 20 66 6f 72 20 65  ne once.** for e
4c70: 76 65 72 79 20 63 61 6c 6c 20 74 6f 20 72 65 5f  very call to re_
4c80: 63 6f 6d 70 69 6c 65 28 29 20 74 6f 20 61 76 6f  compile() to avo
4c90: 69 64 20 6d 65 6d 6f 72 79 20 6c 65 61 6b 73 2e  id memory leaks.
4ca0: 0a 2a 2f 0a 76 6f 69 64 20 72 65 5f 66 72 65 65  .*/.void re_free
4cb0: 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65  (ReCompiled *pRe
4cc0: 29 7b 0a 20 20 69 66 28 20 70 52 65 20 29 7b 0a  ){.  if( pRe ){.
4cd0: 20 20 20 20 73 71 6c 69 74 65 33 5f 66 72 65 65      sqlite3_free
4ce0: 28 70 52 65 2d 3e 61 4f 70 29 3b 0a 20 20 20 20  (pRe->aOp);.    
4cf0: 73 71 6c 69 74 65 33 5f 66 72 65 65 28 70 52 65  sqlite3_free(pRe
4d00: 2d 3e 61 41 72 67 29 3b 0a 20 20 20 20 73 71 6c  ->aArg);.    sql
4d10: 69 74 65 33 5f 66 72 65 65 28 70 52 65 29 3b 0a  ite3_free(pRe);.
4d20: 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d    }.}../*.** Com
4d30: 70 69 6c 65 20 61 20 74 65 78 74 75 61 6c 20 72  pile a textual r
4d40: 65 67 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f  egular expressio
4d50: 6e 20 69 6e 20 7a 49 6e 5b 5d 20 69 6e 74 6f 20  n in zIn[] into 
4d60: 61 20 63 6f 6d 70 69 6c 65 64 20 72 65 67 75 6c  a compiled regul
4d70: 61 72 0a 2a 2a 20 65 78 70 72 65 73 73 69 6f 6e  ar.** expression
4d80: 20 73 75 69 74 61 62 6c 65 20 66 6f 72 20 75 73   suitable for us
4d90: 20 62 79 20 72 65 5f 6d 61 74 63 68 28 29 20 61   by re_match() a
4da0: 6e 64 20 72 65 74 75 72 6e 20 61 20 70 6f 69 6e  nd return a poin
4db0: 74 65 72 20 74 6f 20 74 68 65 0a 2a 2a 20 63 6f  ter to the.** co
4dc0: 6d 70 69 6c 65 64 20 72 65 67 75 6c 61 72 20 65  mpiled regular e
4dd0: 78 70 72 65 73 73 69 6f 6e 20 69 6e 20 2a 70 70  xpression in *pp
4de0: 52 65 2e 20 20 52 65 74 75 72 6e 20 4e 55 4c 4c  Re.  Return NULL
4df0: 20 6f 6e 20 73 75 63 63 65 73 73 20 6f 72 20 61   on success or a
4e00: 6e 0a 2a 2a 20 65 72 72 6f 72 20 6d 65 73 73 61  n.** error messa
4e10: 67 65 20 69 66 20 73 6f 6d 65 74 68 69 6e 67 20  ge if something 
4e20: 67 6f 65 73 20 77 72 6f 6e 67 2e 0a 2a 2f 0a 63  goes wrong..*/.c
4e30: 6f 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 63 6f  onst char *re_co
4e40: 6d 70 69 6c 65 28 52 65 43 6f 6d 70 69 6c 65 64  mpile(ReCompiled
4e50: 20 2a 2a 70 70 52 65 2c 20 63 6f 6e 73 74 20 63   **ppRe, const c
4e60: 68 61 72 20 2a 7a 49 6e 2c 20 69 6e 74 20 6e 6f  har *zIn, int no
4e70: 43 61 73 65 29 7b 0a 20 20 52 65 43 6f 6d 70 69  Case){.  ReCompi
4e80: 6c 65 64 20 2a 70 52 65 3b 0a 20 20 63 6f 6e 73  led *pRe;.  cons
4e90: 74 20 63 68 61 72 20 2a 7a 45 72 72 3b 0a 20 20  t char *zErr;.  
4ea0: 69 6e 74 20 69 2c 20 6a 3b 0a 0a 20 20 2a 70 70  int i, j;..  *pp
4eb0: 52 65 20 3d 20 30 3b 0a 20 20 70 52 65 20 3d 20  Re = 0;.  pRe = 
4ec0: 73 71 6c 69 74 65 33 5f 6d 61 6c 6c 6f 63 28 20  sqlite3_malloc( 
4ed0: 73 69 7a 65 6f 66 28 2a 70 52 65 29 20 29 3b 0a  sizeof(*pRe) );.
4ee0: 20 20 69 66 28 20 70 52 65 3d 3d 30 20 29 7b 0a    if( pRe==0 ){.
4ef0: 20 20 20 20 72 65 74 75 72 6e 20 22 6f 75 74 20      return "out 
4f00: 6f 66 20 6d 65 6d 6f 72 79 22 3b 0a 20 20 7d 0a  of memory";.  }.
4f10: 20 20 6d 65 6d 73 65 74 28 70 52 65 2c 20 30 2c    memset(pRe, 0,
4f20: 20 73 69 7a 65 6f 66 28 2a 70 52 65 29 29 3b 0a   sizeof(*pRe));.
4f30: 20 20 70 52 65 2d 3e 78 4e 65 78 74 43 68 61 72    pRe->xNextChar
4f40: 20 3d 20 6e 6f 43 61 73 65 20 3f 20 72 65 5f 6e   = noCase ? re_n
4f50: 65 78 74 5f 63 68 61 72 5f 6e 6f 63 61 73 65 20  ext_char_nocase 
4f60: 3a 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 3b 0a  : re_next_char;.
4f70: 20 20 69 66 28 20 72 65 5f 72 65 73 69 7a 65 28    if( re_resize(
4f80: 70 52 65 2c 20 33 30 29 20 29 7b 0a 20 20 20 20  pRe, 30) ){.    
4f90: 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20 20  re_free(pRe);.  
4fa0: 20 20 72 65 74 75 72 6e 20 22 6f 75 74 20 6f 66    return "out of
4fb0: 20 6d 65 6d 6f 72 79 22 3b 0a 20 20 7d 0a 20 20   memory";.  }.  
4fc0: 69 66 28 20 7a 49 6e 5b 30 5d 3d 3d 27 5e 27 20  if( zIn[0]=='^' 
4fd0: 29 7b 0a 20 20 20 20 7a 49 6e 2b 2b 3b 0a 20 20  ){.    zIn++;.  
4fe0: 7d 65 6c 73 65 7b 0a 20 20 20 20 72 65 5f 61 70  }else{.    re_ap
4ff0: 70 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f 50 5f  pend(pRe, RE_OP_
5000: 41 4e 59 53 54 41 52 2c 20 30 29 3b 0a 20 20 7d  ANYSTAR, 0);.  }
5010: 0a 20 20 70 52 65 2d 3e 73 49 6e 2e 7a 20 3d 20  .  pRe->sIn.z = 
5020: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29  (unsigned char*)
5030: 7a 49 6e 3b 0a 20 20 70 52 65 2d 3e 73 49 6e 2e  zIn;.  pRe->sIn.
5040: 69 20 3d 20 30 3b 0a 20 20 70 52 65 2d 3e 73 49  i = 0;.  pRe->sI
5050: 6e 2e 6d 78 20 3d 20 28 69 6e 74 29 73 74 72 6c  n.mx = (int)strl
5060: 65 6e 28 7a 49 6e 29 3b 0a 20 20 7a 45 72 72 20  en(zIn);.  zErr 
5070: 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f  = re_subcompile_
5080: 72 65 28 70 52 65 29 3b 0a 20 20 69 66 28 20 7a  re(pRe);.  if( z
5090: 45 72 72 20 29 7b 0a 20 20 20 20 72 65 5f 66 72  Err ){.    re_fr
50a0: 65 65 28 70 52 65 29 3b 0a 20 20 20 20 72 65 74  ee(pRe);.    ret
50b0: 75 72 6e 20 7a 45 72 72 3b 0a 20 20 7d 0a 20 20  urn zErr;.  }.  
50c0: 69 66 28 20 72 65 50 65 65 6b 28 70 52 65 29 3d  if( rePeek(pRe)=
50d0: 3d 27 24 27 20 26 26 20 70 52 65 2d 3e 73 49 6e  ='$' && pRe->sIn
50e0: 2e 69 2b 31 3e 3d 70 52 65 2d 3e 73 49 6e 2e 6d  .i+1>=pRe->sIn.m
50f0: 78 20 29 7b 0a 20 20 20 20 72 65 5f 61 70 70 65  x ){.    re_appe
5100: 6e 64 28 70 52 65 2c 20 52 45 5f 4f 50 5f 4d 41  nd(pRe, RE_OP_MA
5110: 54 43 48 2c 20 52 45 5f 45 4f 46 29 3b 0a 20 20  TCH, RE_EOF);.  
5120: 20 20 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c    re_append(pRe,
5130: 20 52 45 5f 4f 50 5f 41 43 43 45 50 54 2c 20 30   RE_OP_ACCEPT, 0
5140: 29 3b 0a 20 20 20 20 2a 70 70 52 65 20 3d 20 70  );.    *ppRe = p
5150: 52 65 3b 0a 20 20 7d 65 6c 73 65 20 69 66 28 20  Re;.  }else if( 
5160: 70 52 65 2d 3e 73 49 6e 2e 69 3e 3d 70 52 65 2d  pRe->sIn.i>=pRe-
5170: 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20 20 72  >sIn.mx ){.    r
5180: 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20 52 45  e_append(pRe, RE
5190: 5f 4f 50 5f 41 43 43 45 50 54 2c 20 30 29 3b 0a  _OP_ACCEPT, 0);.
51a0: 20 20 20 20 2a 70 70 52 65 20 3d 20 70 52 65 3b      *ppRe = pRe;
51b0: 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 72 65  .  }else{.    re
51c0: 5f 66 72 65 65 28 70 52 65 29 3b 0a 20 20 20 20  _free(pRe);.    
51d0: 72 65 74 75 72 6e 20 22 75 6e 72 65 63 6f 67 6e  return "unrecogn
51e0: 69 7a 65 64 20 63 68 61 72 61 63 74 65 72 22 3b  ized character";
51f0: 0a 20 20 7d 0a 0a 20 20 2f 2a 20 54 68 65 20 66  .  }..  /* The f
5200: 6f 6c 6c 6f 77 69 6e 67 20 69 73 20 61 20 70 65  ollowing is a pe
5210: 72 66 6f 72 6d 61 6e 63 65 20 6f 70 74 69 6d 69  rformance optimi
5220: 7a 61 74 69 6f 6e 2e 20 20 49 66 20 74 68 65 20  zation.  If the 
5230: 72 65 67 65 78 20 62 65 67 69 6e 73 20 77 69 74  regex begins wit
5240: 68 0a 20 20 2a 2a 20 22 2e 2a 22 20 28 69 66 20  h.  ** ".*" (if 
5250: 74 68 65 20 69 6e 70 75 74 20 72 65 67 65 78 20  the input regex 
5260: 6c 61 63 6b 73 20 61 6e 20 69 6e 69 74 69 61 6c  lacks an initial
5270: 20 22 5e 22 29 20 61 6e 64 20 61 66 74 65 72 77   "^") and afterw
5280: 61 72 64 73 20 74 68 65 72 65 20 61 72 65 0a 20  ards there are. 
5290: 20 2a 2a 20 6f 6e 65 20 6f 72 20 6d 6f 72 65 20   ** one or more 
52a0: 6d 61 74 63 68 69 6e 67 20 63 68 61 72 61 63 74  matching charact
52b0: 65 72 73 2c 20 65 6e 74 65 72 20 74 68 6f 73 65  ers, enter those
52c0: 20 6d 61 74 63 68 69 6e 67 20 63 68 61 72 61 63   matching charac
52d0: 74 65 72 73 20 69 6e 74 6f 0a 20 20 2a 2a 20 7a  ters into.  ** z
52e0: 49 6e 69 74 5b 5d 2e 20 20 54 68 65 20 72 65 5f  Init[].  The re_
52f0: 6d 61 74 63 68 28 29 20 72 6f 75 74 69 6e 65 20  match() routine 
5300: 63 61 6e 20 74 68 65 6e 20 73 65 61 72 63 68 20  can then search 
5310: 61 68 65 61 64 20 69 6e 20 74 68 65 20 69 6e 70  ahead in the inp
5320: 75 74 20 0a 20 20 2a 2a 20 73 74 72 69 6e 67 20  ut .  ** string 
5330: 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 74 68 65 20  looking for the 
5340: 69 6e 69 74 69 61 6c 20 6d 61 74 63 68 20 77 69  initial match wi
5350: 74 68 6f 75 74 20 68 61 76 69 6e 67 20 74 6f 20  thout having to 
5360: 72 75 6e 20 74 68 65 20 77 68 6f 6c 65 0a 20 20  run the whole.  
5370: 2a 2a 20 72 65 67 65 78 20 65 6e 67 69 6e 65 20  ** regex engine 
5380: 6f 76 65 72 20 74 68 65 20 73 74 72 69 6e 67 2e  over the string.
5390: 20 20 44 6f 20 6e 6f 74 20 77 6f 72 72 79 20 61    Do not worry a
53a0: 62 6c 65 20 74 72 79 69 6e 67 20 74 6f 20 6d 61  ble trying to ma
53b0: 74 63 68 0a 20 20 2a 2a 20 75 6e 69 63 6f 64 65  tch.  ** unicode
53c0: 20 63 68 61 72 61 63 74 65 72 73 20 62 65 79 6f   characters beyo
53d0: 6e 64 20 70 6c 61 6e 65 20 30 20 2d 20 74 68 6f  nd plane 0 - tho
53e0: 73 65 20 61 72 65 20 76 65 72 79 20 72 61 72 65  se are very rare
53f0: 20 61 6e 64 20 74 68 69 73 20 69 73 0a 20 20 2a   and this is.  *
5400: 2a 20 6a 75 73 74 20 61 6e 20 6f 70 74 69 6d 69  * just an optimi
5410: 7a 61 74 69 6f 6e 2e 20 2a 2f 0a 20 20 69 66 28  zation. */.  if(
5420: 20 70 52 65 2d 3e 61 4f 70 5b 30 5d 3d 3d 52 45   pRe->aOp[0]==RE
5430: 5f 4f 50 5f 41 4e 59 53 54 41 52 20 29 7b 0a 20  _OP_ANYSTAR ){. 
5440: 20 20 20 66 6f 72 28 6a 3d 30 2c 20 69 3d 31 3b     for(j=0, i=1;
5450: 20 6a 3c 73 69 7a 65 6f 66 28 70 52 65 2d 3e 7a   j<sizeof(pRe->z
5460: 49 6e 69 74 29 2d 32 20 26 26 20 70 52 65 2d 3e  Init)-2 && pRe->
5470: 61 4f 70 5b 69 5d 3d 3d 52 45 5f 4f 50 5f 4d 41  aOp[i]==RE_OP_MA
5480: 54 43 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 20  TCH; i++){.     
5490: 20 75 6e 73 69 67 6e 65 64 20 78 20 3d 20 70 52   unsigned x = pR
54a0: 65 2d 3e 61 41 72 67 5b 69 5d 3b 0a 20 20 20 20  e->aArg[i];.    
54b0: 20 20 69 66 28 20 78 3c 3d 31 32 37 20 29 7b 0a    if( x<=127 ){.
54c0: 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e          pRe->zIn
54d0: 69 74 5b 6a 2b 2b 5d 20 3d 20 28 75 6e 73 69 67  it[j++] = (unsig
54e0: 6e 65 64 20 63 68 61 72 29 78 3b 0a 20 20 20 20  ned char)x;.    
54f0: 20 20 7d 65 6c 73 65 20 69 66 28 20 78 3c 3d 30    }else if( x<=0
5500: 78 66 66 66 20 29 7b 0a 20 20 20 20 20 20 20 20  xfff ){.        
5510: 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20  pRe->zInit[j++] 
5520: 3d 20 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72  = (unsigned char
5530: 29 28 30 78 63 30 20 7c 20 28 78 3e 3e 36 29 29  )(0xc0 | (x>>6))
5540: 3b 0a 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a  ;.        pRe->z
5550: 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78 38 30  Init[j++] = 0x80
5560: 20 7c 20 28 78 26 30 78 33 66 29 3b 0a 20 20 20   | (x&0x3f);.   
5570: 20 20 20 7d 65 6c 73 65 20 69 66 28 20 78 3c 3d     }else if( x<=
5580: 30 78 66 66 66 66 20 29 7b 0a 20 20 20 20 20 20  0xffff ){.      
5590: 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b    pRe->zInit[j++
55a0: 5d 20 3d 20 28 75 6e 73 69 67 6e 65 64 20 63 68  ] = (unsigned ch
55b0: 61 72 29 28 30 78 64 30 20 7c 20 28 78 3e 3e 31  ar)(0xd0 | (x>>1
55c0: 32 29 29 3b 0a 20 20 20 20 20 20 20 20 70 52 65  2));.        pRe
55d0: 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30  ->zInit[j++] = 0
55e0: 78 38 30 20 7c 20 28 28 78 3e 3e 36 29 26 30 78  x80 | ((x>>6)&0x
55f0: 33 66 29 3b 0a 20 20 20 20 20 20 20 20 70 52 65  3f);.        pRe
5600: 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30  ->zInit[j++] = 0
5610: 78 38 30 20 7c 20 28 78 26 30 78 33 66 29 3b 0a  x80 | (x&0x3f);.
5620: 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20        }else{.   
5630: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
5640: 20 20 7d 0a 20 20 20 20 7d 0a 20 20 20 20 69 66    }.    }.    if
5650: 28 20 6a 3e 30 20 26 26 20 70 52 65 2d 3e 7a 49  ( j>0 && pRe->zI
5660: 6e 69 74 5b 6a 2d 31 5d 3d 3d 30 20 29 20 6a 2d  nit[j-1]==0 ) j-
5670: 2d 3b 0a 20 20 20 20 70 52 65 2d 3e 6e 49 6e 69  -;.    pRe->nIni
5680: 74 20 3d 20 6a 3b 0a 20 20 7d 0a 20 20 72 65 74  t = j;.  }.  ret
5690: 75 72 6e 20 70 52 65 2d 3e 7a 45 72 72 3b 0a 7d  urn pRe->zErr;.}
56a0: 0a 0a 2f 2a 0a 2a 2a 20 49 6d 70 6c 65 6d 65 6e  ../*.** Implemen
56b0: 74 61 74 69 6f 6e 20 6f 66 20 74 68 65 20 72 65  tation of the re
56c0: 67 65 78 70 28 29 20 53 51 4c 20 66 75 6e 63 74  gexp() SQL funct
56d0: 69 6f 6e 2e 20 20 54 68 69 73 20 66 75 6e 63 74  ion.  This funct
56e0: 69 6f 6e 20 69 6d 70 6c 65 6d 65 6e 74 73 0a 2a  ion implements.*
56f0: 2a 20 74 68 65 20 62 75 69 6c 64 2d 69 6e 20 52  * the build-in R
5700: 45 47 45 58 50 20 6f 70 65 72 61 74 6f 72 2e 20  EGEXP operator. 
5710: 20 54 68 65 20 66 69 72 73 74 20 61 72 67 75 6d   The first argum
5720: 65 6e 74 20 74 6f 20 74 68 65 20 66 75 6e 63 74  ent to the funct
5730: 69 6f 6e 20 69 73 20 74 68 65 0a 2a 2a 20 70 61  ion is the.** pa
5740: 74 74 65 72 6e 20 61 6e 64 20 74 68 65 20 73 65  ttern and the se
5750: 63 6f 6e 64 20 61 72 67 75 6d 65 6e 74 20 69 73  cond argument is
5760: 20 74 68 65 20 73 74 72 69 6e 67 2e 20 20 53 6f   the string.  So
5770: 2c 20 74 68 65 20 53 51 4c 20 73 74 61 74 65 6d  , the SQL statem
5780: 65 6e 74 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20  ents:.**.**     
5790: 20 20 41 20 52 45 47 45 58 50 20 42 0a 2a 2a 0a    A REGEXP B.**.
57a0: 2a 2a 20 69 73 20 69 6d 70 6c 65 6d 65 6e 74 65  ** is implemente
57b0: 64 20 61 73 20 72 65 67 65 78 70 28 42 2c 41 29  d as regexp(B,A)
57c0: 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64  ..*/.static void
57d0: 20 72 65 5f 73 71 6c 5f 66 75 6e 63 28 0a 20 20   re_sql_func(.  
57e0: 73 71 6c 69 74 65 33 5f 63 6f 6e 74 65 78 74 20  sqlite3_context 
57f0: 2a 63 6f 6e 74 65 78 74 2c 20 0a 20 20 69 6e 74  *context, .  int
5800: 20 61 72 67 63 2c 20 0a 20 20 73 71 6c 69 74 65   argc, .  sqlite
5810: 33 5f 76 61 6c 75 65 20 2a 2a 61 72 67 76 0a 29  3_value **argv.)
5820: 7b 0a 20 20 52 65 43 6f 6d 70 69 6c 65 64 20 2a  {.  ReCompiled *
5830: 70 52 65 3b 20 20 20 20 20 20 20 20 20 20 2f 2a  pRe;          /*
5840: 20 43 6f 6d 70 69 6c 65 64 20 72 65 67 75 6c 61   Compiled regula
5850: 72 20 65 78 70 72 65 73 73 69 6f 6e 20 2a 2f 0a  r expression */.
5860: 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 50    const char *zP
5870: 61 74 74 65 72 6e 3b 20 20 20 20 20 2f 2a 20 54  attern;     /* T
5880: 68 65 20 72 65 67 75 6c 61 72 20 65 78 70 72 65  he regular expre
5890: 73 73 69 6f 6e 20 2a 2f 0a 20 20 63 6f 6e 73 74  ssion */.  const
58a0: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a   unsigned char *
58b0: 7a 53 74 72 3b 2f 2a 20 53 74 72 69 6e 67 20 62  zStr;/* String b
58c0: 65 69 6e 67 20 73 65 61 72 63 68 65 64 20 2a 2f  eing searched */
58d0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
58e0: 45 72 72 3b 20 20 20 20 20 20 20 20 20 2f 2a 20  Err;         /* 
58f0: 43 6f 6d 70 69 6c 65 20 65 72 72 6f 72 20 6d 65  Compile error me
5900: 73 73 61 67 65 20 2a 2f 0a 20 20 69 6e 74 20 73  ssage */.  int s
5910: 65 74 41 75 78 20 3d 20 30 3b 20 20 20 20 20 20  etAux = 0;      
5920: 20 20 20 20 20 2f 2a 20 54 72 75 65 20 74 6f 20       /* True to 
5930: 69 6e 76 6f 6b 65 20 73 71 6c 69 74 65 33 5f 73  invoke sqlite3_s
5940: 65 74 5f 61 75 78 64 61 74 61 28 29 20 2a 2f 0a  et_auxdata() */.
5950: 0a 20 20 70 52 65 20 3d 20 73 71 6c 69 74 65 33  .  pRe = sqlite3
5960: 5f 67 65 74 5f 61 75 78 64 61 74 61 28 63 6f 6e  _get_auxdata(con
5970: 74 65 78 74 2c 20 30 29 3b 0a 20 20 69 66 28 20  text, 0);.  if( 
5980: 70 52 65 3d 3d 30 20 29 7b 0a 20 20 20 20 7a 50  pRe==0 ){.    zP
5990: 61 74 74 65 72 6e 20 3d 20 28 63 6f 6e 73 74 20  attern = (const 
59a0: 63 68 61 72 2a 29 73 71 6c 69 74 65 33 5f 76 61  char*)sqlite3_va
59b0: 6c 75 65 5f 74 65 78 74 28 61 72 67 76 5b 30 5d  lue_text(argv[0]
59c0: 29 3b 0a 20 20 20 20 69 66 28 20 7a 50 61 74 74  );.    if( zPatt
59d0: 65 72 6e 3d 3d 30 20 29 20 72 65 74 75 72 6e 3b  ern==0 ) return;
59e0: 0a 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 63  .    zErr = re_c
59f0: 6f 6d 70 69 6c 65 28 26 70 52 65 2c 20 7a 50 61  ompile(&pRe, zPa
5a00: 74 74 65 72 6e 2c 20 30 29 3b 0a 20 20 20 20 69  ttern, 0);.    i
5a10: 66 28 20 7a 45 72 72 20 29 7b 0a 20 20 20 20 20  f( zErr ){.     
5a20: 20 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20   re_free(pRe);. 
5a30: 20 20 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73       sqlite3_res
5a40: 75 6c 74 5f 65 72 72 6f 72 28 63 6f 6e 74 65 78  ult_error(contex
5a50: 74 2c 20 7a 45 72 72 2c 20 2d 31 29 3b 0a 20 20  t, zErr, -1);.  
5a60: 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 20 20      return;.    
5a70: 7d 0a 20 20 20 20 69 66 28 20 70 52 65 3d 3d 30  }.    if( pRe==0
5a80: 20 29 7b 0a 20 20 20 20 20 20 73 71 6c 69 74 65   ){.      sqlite
5a90: 33 5f 72 65 73 75 6c 74 5f 65 72 72 6f 72 5f 6e  3_result_error_n
5aa0: 6f 6d 65 6d 28 63 6f 6e 74 65 78 74 29 3b 0a 20  omem(context);. 
5ab0: 20 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 20       return;.   
5ac0: 20 7d 0a 20 20 20 20 73 65 74 41 75 78 20 3d 20   }.    setAux = 
5ad0: 31 3b 0a 20 20 7d 0a 20 20 7a 53 74 72 20 3d 20  1;.  }.  zStr = 
5ae0: 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20  (const unsigned 
5af0: 63 68 61 72 2a 29 73 71 6c 69 74 65 33 5f 76 61  char*)sqlite3_va
5b00: 6c 75 65 5f 74 65 78 74 28 61 72 67 76 5b 31 5d  lue_text(argv[1]
5b10: 29 3b 0a 20 20 69 66 28 20 7a 53 74 72 21 3d 30  );.  if( zStr!=0
5b20: 20 29 7b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f   ){.    sqlite3_
5b30: 72 65 73 75 6c 74 5f 69 6e 74 28 63 6f 6e 74 65  result_int(conte
5b40: 78 74 2c 20 72 65 5f 6d 61 74 63 68 28 70 52 65  xt, re_match(pRe
5b50: 2c 20 7a 53 74 72 2c 20 2d 31 29 29 3b 0a 20 20  , zStr, -1));.  
5b60: 7d 0a 20 20 69 66 28 20 73 65 74 41 75 78 20 29  }.  if( setAux )
5b70: 7b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 73 65  {.    sqlite3_se
5b80: 74 5f 61 75 78 64 61 74 61 28 63 6f 6e 74 65 78  t_auxdata(contex
5b90: 74 2c 20 30 2c 20 70 52 65 2c 20 28 76 6f 69 64  t, 0, pRe, (void
5ba0: 28 2a 29 28 76 6f 69 64 2a 29 29 72 65 5f 66 72  (*)(void*))re_fr
5bb0: 65 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a  ee);.  }.}../*.*
5bc0: 2a 20 49 6e 76 6f 6b 65 20 74 68 69 73 20 72 6f  * Invoke this ro
5bd0: 75 74 69 6e 65 20 74 6f 20 72 65 67 69 73 74 65  utine to registe
5be0: 72 20 74 68 65 20 72 65 67 65 78 70 28 29 20 66  r the regexp() f
5bf0: 75 6e 63 74 69 6f 6e 20 77 69 74 68 20 74 68 65  unction with the
5c00: 0a 2a 2a 20 53 51 4c 69 74 65 20 64 61 74 61 62  .** SQLite datab
5c10: 61 73 65 20 63 6f 6e 6e 65 63 74 69 6f 6e 2e 0a  ase connection..
5c20: 2a 2f 0a 23 69 66 64 65 66 20 5f 57 49 4e 33 32  */.#ifdef _WIN32
5c30: 0a 5f 5f 64 65 63 6c 73 70 65 63 28 64 6c 6c 65  .__declspec(dlle
5c40: 78 70 6f 72 74 29 0a 23 65 6e 64 69 66 0a 69 6e  xport).#endif.in
5c50: 74 20 73 71 6c 69 74 65 33 5f 72 65 67 65 78 70  t sqlite3_regexp
5c60: 5f 69 6e 69 74 28 0a 20 20 73 71 6c 69 74 65 33  _init(.  sqlite3
5c70: 20 2a 64 62 2c 20 0a 20 20 63 68 61 72 20 2a 2a   *db, .  char **
5c80: 70 7a 45 72 72 4d 73 67 2c 20 0a 20 20 63 6f 6e  pzErrMsg, .  con
5c90: 73 74 20 73 71 6c 69 74 65 33 5f 61 70 69 5f 72  st sqlite3_api_r
5ca0: 6f 75 74 69 6e 65 73 20 2a 70 41 70 69 0a 29 7b  outines *pApi.){
5cb0: 0a 20 20 69 6e 74 20 72 63 20 3d 20 53 51 4c 49  .  int rc = SQLI
5cc0: 54 45 5f 4f 4b 3b 0a 20 20 53 51 4c 49 54 45 5f  TE_OK;.  SQLITE_
5cd0: 45 58 54 45 4e 53 49 4f 4e 5f 49 4e 49 54 32 28  EXTENSION_INIT2(
5ce0: 70 41 70 69 29 3b 0a 20 20 72 63 20 3d 20 73 71  pApi);.  rc = sq
5cf0: 6c 69 74 65 33 5f 63 72 65 61 74 65 5f 66 75 6e  lite3_create_fun
5d00: 63 74 69 6f 6e 28 64 62 2c 20 22 72 65 67 65 78  ction(db, "regex
5d10: 70 22 2c 20 32 2c 20 53 51 4c 49 54 45 5f 55 54  p", 2, SQLITE_UT
5d20: 46 38 2c 20 30 2c 0a 20 20 20 20 20 20 20 20 20  F8, 0,.         
5d30: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
5d40: 20 20 20 20 20 20 20 20 72 65 5f 73 71 6c 5f 66          re_sql_f
5d50: 75 6e 63 2c 20 30 2c 20 30 29 3b 0a 20 20 72 65  unc, 0, 0);.  re
5d60: 74 75 72 6e 20 72 63 3b 0a 7d 0a                 turn rc;.}.