Головна » Статті » Інформатика | [ Додати статтю ] |
Бази даних у Internet
Бази даних були природньо поєднані з WWW і CGI з самого початку Web. Фактично, Web є неосяжною всесвітньою базою даних, колекцією даних і ресурсів, доступних за допомогою клацання мишкою.
На вищому рівні, взаємодія з серверними базами даних є одним з найбільш природних застосувань CGI. Кінцевий користувач може представити запит через форму і мати результати, які показуються безпосередньо назад до його вікна перегляду. Через те, що протягом транзакції з базою даних взаємодія у реальному часі звичайно не потрібна, однієї з головних перешкод CGI (відсутність постійного зв'язку) уникають одразу. Крім того, розмір бази даних майже не впливає на швидкість транзакції, тому що до клієнта посилаються тільки результати запиту. (Будь-хто, хто використовував один з пошуковиків Web, - наприклад, AltaVista або Lycos, може підтвердити це.) Хоч будь-який вид бази даних доступний через CGI, є декілька типів баз даних, які стали дуже популярними на Павутині: • Невеликі текстові бази даних. Вони є найлегшими для створення та корисними для багатьох малих або середніх задач. Ці бази даних є просто файлами ASCII з розмежуванням або записами фіксованої довжини. Адресні книги, списки, і такі інші бази даних з обмеженим рядом елементів добре відповідають вимогам саме цього методу. • Бази даних Web. Природніми кандидатами для баз даних Web є безпосередньо Web. Служби, які контролюють великі порції Павутини (наприклад, Usenet, Gopher, і так далі) виникають дуже часто. Це можна також застосувати до локальних мереж і єдиних машин. Індексне програмне забезпечення, подібне до freeWais або Ice може створити базу даних повного сайту, який потім буде доступний через програми CGI. • Великі серверні бази даних. Великі бази даних взагалі зберігаються в сервері деякої бази даних (навіть якщо сервер є також клієнт, як наприклад найбільш загальні базові бази даних Windows). Поки сервер має деякий інтерфейсний метод для інших програмам, інформація в цих базах даних буде доступна з програм CGI. Практично, бази даних Web можуть бути деякою комбінацією вищевказаних. Кожна база даних має власні потреби, і програми CGI часто повинні бути налагодженими, щоб відповідати вимогам вашої конкретної бази даних. Інтерфейси Баз даних Для ефективного поєднання вашої бази даних з Web без будь-яких втрат, CGI повинен використовуватися як в інтерфейсі так і в реалізації взаємодії бази даних. Інтерфейс CGI Поперше, треба розглянути те, як користувач збирається ввести запити до бази даних. Форма HTML є найбільш загальним шляхом для користувача, щоб представити інформацію, хоч є і інші шляхи. Як приклад, розглянемо інтерфейс до адресної книги. Проста форма могла б бути схожою з цим: My Address Book Welcome to my address book To find addresses that match a certain category, fill in that category and then press 'submit'. Name: Phone: Street Address: City: State: Zip: Ця форма викликає CGI-скрипт address.cgi. Це є інтерфейс взаємодії з базою даних. Намір інтерфейсу - забрати дані з форми, проаналізувати їх, і передати запит до бази даних. Якщо база даних є текстовим ASCII-файлом, інтерфейс є також і реалізацією. Він повинний зробити пошук, інтерпретувати дані, і потім передати результати назад до клієнта. Для серверів баз даних (включаючи такі індекси Web,як freeWais і Ice), інтерфейс повинний надати запиту форму, яку сервер зрозуміє, і потім передати запит до сервера. CGI-програма повинна потім забрати результати і передати їх до користувача. Дуже часто в цьому випадку інтерфейси і реалізації містяться в тій же програмі. На системах, які підтримують це (UNIX, Amiga, і інші), для цього можна застосовувати розгалуження процесу. У Windows-середовищі, необхідні спеціальні програми, які використовують OLE або деякий інший тип зв'язку. Щоб повернутися до прикладу адресної книги, можна створити в даний момент програму CGI, яка відповість запиту клієнта. По-перше, нам потрібно знати формат бази даних безпосередньо. Малий текстовий формат є достатнім для наших потреб. Ми повинні використовувати розмежовані дані, хоч записи фіксованої довжини повинні також працювати. Запис прикладу слідує: 0:Elmer J. Fudd:555-1234:42 Jones Lane:Chuckville:CA:90210Цей формат буде добре обізнаний до будь-кого, хто бачив файл пароля UNIX. Є дві перешкоди до цього формату. Сума всіх полів не може перевищити ніяких обмежень лінійної довжини на будь-якій системі, яку ви використовуєте (в нашому випадку, це не має бути проблемою). Також, розділювач (двокрапка) не повинний з'являтися в будь-якому полі, або це буде сприйнято як початок нового поля. У ідеальному світі, це не повинне бути проблемою (, якщо не хто-небудь, хто живе за адресою "Нью-йорк: Місто"). Але фактично, люди роблять памылки. Таким чином, треба бути ознайомленим з цією потенційною проблемою. Тепер, коли ми знаємо форму бази даних, ми можемо почати програму CGI, щоб зібрати інформацію від форми. Будь-яка мова може використатися для написання CGI, але в цьому прикладі використано Perl для використання можливостей обробки тексту. #!/bin/perl require cgi_head; # Дістати дані з форми та роздрукувати заголовок. !!!!! У всіх CGI, написаних на Perl в цьому розділі, модуль cgi_head.pm використовується, для збору інформації від форми і надрукувати необхідний заголовок HTML. Цей модуль розміщує вхід форми з ім'ям 'foo' в асоціативний вхід з ім'ям $FORM{'foo'}. Існує декілька вільнодоступних програм для декількох мов, для виконання цього, включаючи CGI.pm для Perl : http://www.perl.com/perl/CPAN/ Тепер, коли дані з форми були прочитані, треба прочитати записи в базі даних безпосередньо. Через те, що ми використовуємо розмежовану базу даних, найлегше прочитати з повної бази даних. База даних поля фіксованої довжини повинна дати нам можливість просуватися через базу даних без читання інформації, але цей метод має власні перешкоди (найбільш очевидне те, що дані не повинні перевищувати незмінну довжину). Ми читаємо базу даних, як плаский ASCIІ-файл і аналізуємо це полінійно, використовуючи зручну Perl-конструкцію while(). !!!!! Цей приклад вимагав Perl 5.001 або вище, через використання звертань, які не включалися в Perl 4 (або раніше). Perl 5 містить багато покращень та нових можливостей і є необхідним для будь-якого Перломану -доступний на http://www.perl.com/perl/CPAN/ # Спершу, відкрийте базу даних. (тут 'database.txt'.) open (DAT, "database.txt") || die "Can't open the database: $! !.\n"; $maxn = 0; # лічильник записів. while () { chop; @field = split(/:/); # розбити запис на окремі поля $n = $field[0]; # Перше поле є ID номером $add[$n]{'name'} = $field[1]; # Потім ім'я $add[$n]{'phone'} = $field[2]; # тел. номер $add[$n]{'street'} = $field[3]; # адреса $add[$n]{'city'} = $field[4]; # місто $add[$n]{'state'} = $field[5]; # країна $add[$n]{'zip'} = $field[6]; # поштовий індекс } $maxn = $n # Встановлено max номер до останнього запису Тепер, коли база даних була завантажена, нам потрібно порівняти запит користувача з даними : @results = (); # обнулити вихідний масив. if ($name = $FORM{'name'}) { # пошук за ім'ям, for ($I = 0; $I if ($zip eq $add[$I]{'zip'}) { push(@results,$I); } } if (!@results) { &exitnone; } } elsif ($zip = $FORM{'zip'}) { @r2 = @results; foreach $I (@r2) { if ($zip ne $add[$I]{'zip'}) { @results = grep(!/$I/,@results); } } if (!@results) { &exitnone; } } У цей момент, або ми маємо успішні співпадання, які зберігаються в масиві @results, або ми не маємо співпаданнь, і в цьому випадку ми викликаємо підпрограму &exitnone. Тепер ми можемо видати клієнту результати (або їх відсутність). # якщо немає результатівБ видати повідомлення та вийти. sub exitnone { Your entry has been added to the address book Go back to the form to add another user. EOF Насправді, цей скрипт CGI просто приєднує новий запис до бази даних. Якщо хтось інший змінює базу даних в той же час, одна із змін буде втрачена або повна база даних стане зіпсованою. Щоб обійти це, ми використовуємо lock-файл, щоб сказати, чи хтось інший пише до бази даних. Це далеко не найелегантніше вирішення, і більшість систем забезпечують функцію flock(), щоб більш ефективно замкнути файл від паралельної вибірки. По-друге, номер ID запису повинен бути визначений. У цьому випадку, ми можемо допускати, що записи будуть послідовно нумеровані і, що останній вхід матиме останній номер ID. Так що ми просто читаємо останню лінію бази даних, захоплюємо номер ID від нього, і потім прирощуємо його, щоб одержати новий номер ID. Тепер, коли будь-хто може додати записи до адресної книги, може стати необхідним, викреслити або змінити записи. Щоб зробити, це, однак, має бути деякий спосіб для користувача, щоб вказати на бажаний вхід який треба змінити або викреслити. Замість створення всієї нової форми для цього, ми можемо додати ці функціональні можливості до нашого існуючого CGІ-пошуку. Якщо пошук користувача повертає точно один результат, лінія може бути додана до сторінки результату HTML, яка пропонує на вибір змінити або викреслити цей вхід. (Це могло б бути зроблене для більш ніж одного результату досить легко, але ми працюємо з одним заради стислості). Це може бути зроблено за допомогою зміни наступних ліній в дні пошуку CGI: print for ($I = 0; $I Тепер, нарешті, вилучення і модифікація записів у базі даних. Подібно текстовій базі даних, зміна повинна бути внесена до форми HTML, яка генерується програмою пошуку. На відміну від текстової бази даних, ми не маємо унікального номера ID, щоб розпізнавати вхід. Таким чином, ми повинні вибрати інший унікальний атрибут, щоб розпізнати вхід. Ми могли б додати номер ID в базу даних, але заради простоти, ми використовуватимемо ім'я, як унікальне поле. (І, якщо ви знаєте два людей з точно тими ж першими, останніми, і середніми іменами, ви знаєте дуже багато людей.) Програма CGI пошуку print ""; print "Go back to the form to make another search.\n"; print "\n"; стає такою : print ""; print "Go back to the form to make another search.\n"; if ($I == 1) { print "Delete this entry."; print "Modify this entry."; } print "\n"; безпосереднє спрощення CGI: #!/bin/perl require cgi_head; use Msql; $dbh = Connect Msql; SelectDB $dbh "addresses"; $all = "name, phone, street, city, state, zip"; if ($FORM{'a'} eq "d") { Query $dbh "DELETE FROM addresses WHERE name=$FORM{'name'}"; print • Який розмір вашого проекту? Розмір має велике значення. Як ми бачили, пласкі текстові базові бази даних просто не звертають уваги на розмір. 50 MB версія нашої фонової книги могла б поставити навіть найбільш могутній RISC-сервер на коліна. У той же час, треба багато часу, щоб створити БД, яка використовує сервер. Вам потрібно мати дозвіл, і поперед усе, вам потрібно мати доступ до сервера. Якщо ви є студент з університетським account'ом, є шанс, що текст - це все, з чим необхідно мати справу. Навіть сервери баз даних звертають увагу на розмір і складність вашого проекту - зберігання бази даних всіх телефонних номерів в Америці могло б бути заведикою роботою навіть для окремої бази даних, подібної Access або Paradox. З іншого боку, база даних з таблицями, які з'єднуються з таблицями непрямими та переплутанитими шляхами є просто неможлива у вільнодоступних серверах, подібних до mSQL. (POSTGRES має більші функціональні можливості, за рахунок швидкості, складності, і відсутності стандартного інтерфейсу SQL) Перш ніж писати проект, спробуйте передбачити максимальний розмір і план відповідно. • Програмувати або ні? Зі значним списком ресурсів, показаних раніше в розділі, чому будь-хто має писати власні CGI взагалі? Можливо ви не будете робити цього. кщо ви маєте зайві гроші, є шанс, що що-небудь відповідатиме вашим вимогам. Навіть якщо ви не багатій, ви можливо знайдете щось схоже. Але цього не завжди достатньо. Невеличкого знання того, як CGI спілкуються з базами даних, може вистачити надовго. • Є там альтернатива до CGI? Павутина є велике місце,вона зростає кожного дня, і CGI є не єдиною грою. Не потрапте до пастки ігнорування нових технологій тільки через те, що вони нові. (У той же час, не будьте сліпим до їхніх дефектів. Кожна нова мова або протокол повинні пройти через період випробування. Протягом цього часу, використання програм, написаних на новій мовй або з новими протоколами, потенційно викликають пошкодження - або безпосередньо, або за допомогою через діри безпеки). Декілька компаній розвинули первинні Web-сервери, які специфічно розробляються з інтерфейсом до баз даних. Наприклад, NeXT Inc.'s WebObjects (http://www.next.com) є новим об'єктно-орієнтованим Web-сервером, який безпосередньо взаємодіє з могутньою внутрішньою базою даних. На додаток до них є Java та величезний галас коло неї на першому році життя в Internet. Java має здатність відкрити прямі зв'язки між сервером і клієнтом, надаючи засоби для коректування бази даних безперервно. Наприклад, використання Java з базою даних наявних цін могло б забезпечити змінюючийся маятник на екрані користувача. Однак , стережіться: Java є типовою "новою технологією" з всім добром і злом, що приходить разом. Використання CGI для інтеграції баз даних з Web природньо випливає з можливостей CGI. Не звертаючи уваги на недоліки CGI, взаємодія баз даних, можливо, одна з єдиних областей, в яких CGI збережеться як найкращий інструментальний засіб перед обличчям нових технологій. | |
Переглядів: 1625 | Коментарі: 1 | |
Всього коментарів: 0 | |