Задачи статистики и базы данных в Python

Багирус японская косметика. | зрелые проститутки питера проспект ветеранов viagra

Задачи статистики в пакете SPSS

Два студента Норман Най (Norman Nie) и Дейл Вент (Dale Bent), специализировавшиеся в области политологии в 1965 году пытались отыскать в Стенфордском университете Сан-Франциско компьютерную программу, подходящую для анализа статистической информации. Вскоре они разочаровались в своих попытках, так как имеющиеся программы оказывались более или менее непригодными, неудачно построенными или не обеспечивали наглядность представления обработанной информации. К тому же принципы пользования менялись от программы к программе.
Так, не долго думая, они решили разработать собственную программу, со своей концепцией и единым синтаксисом. В их распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).
Как известно из истории развития информатики, программы тогда представляли собой пакеты перфокарт. Как раз на это указывает и исходное название программы, которое авторы дали своему продукту: SPSS — это аббревиатура от Statistical Package for the Social Science.
В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму — к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей описывало одиннадцать различных процедур.
Спустя пять лет SPSS была уже инсталлирована шестьсот раз, причём под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.

Часть 1. Программа SPSS
SPSS является самой распространённой программой для обработки статистической информации. В настоящем разделе описан путь этой программы к такому выдающемуся успеху. Затем приведен обзор отдельных модулей программы.

Программа SPSS
1.1 История SPSS
1.2 Новое в версии 10.0
1.3 Модули SPSS

Часть 2. Инсталляция
В этой главе мы покажем, как установить SPSS с компакт-диска, создать ярлык на эту программу и задать рабочий каталог. Далее мы расскажем об установке прилагаемого к книге компакт-диска примеров.

Инсталляция
2.1 Системные требования для инсталляции SPSS
2.2 Инсталляция SPSS
2.3 Создание ярлыка
2.4 Установка рабочего каталога
2.5 Инсталляция прилагаемого компакт-диска
2.6 Возобновление лицензии
2.7 Добавление компонентов

Часть 3. Подготовка данных
В этой главе мы на небольшом примере опишем процесс подготовки данных. За основу мы возьмем вымышленный опрос — так называемый "воскресный вопрос", который студенты, изучающие политологию в Марбургском университете, задавали избирателям

Подготовка данных
3.1 Кодирование и кодировочная таблица
3.2 Матрица данных
3.3 Запуск SPSS
3.4 Редактор данных
3.4.1 Определение переменных
3.4.2 Ввод данных
3.5 Сохранение файла данных
3.6 Копирование описаний переменных
3.7 Завершение сеанса работы

Часть 4. SPSS для Windows — обзор
В этой главе мы хотим дать обзор использования SPSS для Windows на примере файлов данных wahl.sav и zahri.sav. Наш обзор в первую очередь будет касаться технических приемов работы с программой.

PSS для Windows — обзор
4.1 Выбор статистической процедуры
4.2. Настройки редактора данных
4.3 Панели символов
4.4 Построение и редактирование графиков
4.5 Окно просмотра
4.6 Редактирование таблиц
4.6.1 Редактор мобильных таблиц
4.6.2 Дополнительные возможности редактирования таблиц
4.6.3 Операции с таблицами большого размера
4.6.4 Окно просмотра текста
4.7 Редактор синтаксиса
4.8 Информация о файле
4.9 Справочная система
4.10 Настройки

Часть 5. Основы статистики
Овладение приемами работы с такой программой, как SPSS требует предварительных познаний в области статистики. Здесь мы коротко остановимся на некоторых основных понятиях, с которыми непременно должен быть знаком пользователь, если он хочет использовать SPSS. В первую очередь сюда относятся предварительные оценки, которые выполняются перед проведением любого статистического теста: классификация переменных по статистическим шкалам, проверка наличия нормального распределения и выделение независимых и зависимых выборок. В следующих разделах представлено описание наиболее часто проводимой процедуры проверки гипотезы о среднем значении и рассматривается значение вероятности ошибки р.

Основы статистики
5.1 Предварительные условия для проведения статистического теста
5.1.1 Типы статистических шкал
5.1.2 Нормальное распределение
5.1.3 Зависимость и независимость выборок
5.2 Обзор распространенных тестов для проверки гипотез о среднем
5.3 Вероятность ошибки р
5.4 Обзор статистических методов
5.4.1 Структурирование, вводи проверка данных
5.4.2 Описательный (дескриптивный) анализ
5.4.3 Аналитическая статистика

Часть 6. Частотный анализ.
Первым этапом статистического анализа данных, как правило, является частотный анализ. В этой главе мы проведем частотный анализ на примере файла Studium.sav. Этот файл находится на компакт-диске примеров или в рабочем каталоге \SPSSBOOK. Он содержит результаты опроса студентов об их психическом состоянии и социальном положении. Опрос касался таких предметов, как социальное положение, психическая ситуация и успеваемость.

Частотный анализ
6.1 Частотные таблицы
6.2 Вывод статистических характеристик
6.3 Медиана для концентрированных данных
6.4 Форматы частотных таблиц
6.5 Графическое представление

Часть 7. Отбор данных
В этой главе мы на примере файлов wahl.sav и studium.sav покажем разнообразные возможности, предоставляемые в SPSS для отбора данных. Отбор данных — это выбор наблюдений по определенным критериям; так, например, при опросе избирателей (файл wahl.sav) можно отобрать только мужчин, голосующих за ХДС/ХСС, а при опросе студентов (файл studium.sav) — только студенток, изучающих психологию и медицину. После этого все вычисления будут проводиться только с этими отобранными наблюдениям.

Отбор данных
7.1 Выбор наблюдений
7.1.1 Классификация операторов
7.1.2 Операторы отношения
7.1.3 Логические операторы
7.1.4 Булева алгебра
7.1.5 Функции
7.1.6 Ввод условного выражения
7.1.7 Примеры отбора данных
7.2 Извлечение случайной выборки
7.3 Сортировка наблюдений
7.4 Разделение наблюдений на группы

Часть 8. Модификация данных
Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных.

Модификация данных
8.1 Вычисление новых переменных
8.1.1 Формулировка численных выражений
8.1.2 Функции
8.2 Подсчет частоты появлений определенных значений
8.3 Перекодирование значений
8.3.1 Ручное перекодирование
8.3.2 Автоматическое перекодирование
8.4 Вычисление новых переменных в соответствии с определенными условиями
8.4.1 Формулировка условий
8.4.2 Создание индекса
8.5 Агрегирование данных
8.6 Ранговые преобразования
8.6.1 Пример рангового преобразования
8.6.2 Типы рангов
8.7 Веса случаев
8.7.1 Коррекция при отсутствии репрезентативности
8.7.2 Анализ концентрированных данных
8.8 Примеры вычисления новых переменных
8.8.1 Первый пример: вычисление расхода бензина
8.8.2 Второй пример: вычисление даты пасхи

Часть 9. Статистические характеристики
Статистические характеристики вычисляются в основном для переменных, относящихся к интервальной шкале. Для этого используются следующие четыре команды меню.

Статистические характеристики
9.1 Описательная статистика
9.2 Сводка наблюдений

Часть 10. Исследование данных
Когда данные введены в компьютер, не следует сразу же приступать к анализу. На первом этапе сами данные следует подвергнуть подробному и всестороннему исследованию. Подобное исследование преследует три основных цели

Исследование данных
10.1 Обнаружение ошибок ввода
10.2 Проверка закона распределения
10.3 Вычисление характеристик
10.4 Исследование данных
10.4.1 Анализ без группирующей переменной
10.4.2 Анализ для групп наблюдений

Часть 11. Таблицы сопряженности
В SPSS имеется большое количество разнообразных процедур, при помощи которых можно произвести анализ связи между двумя переменными. Связь между неметрическими переменными, то есть переменными, относящимися к номинальной шкалу или к порядковой шкале с не очень большим количеством категорий, лучше всего представить в форме таблиц сопряженности. Для этой цели в SPSS реализован тест %2, при котором проверяется, есть ли значимое различие между наблюдаемыми и ожидаемыми частотами. Кроме того, существует возможность расчета различных мер связанности.

Таблицы сопряженности
11.1 Создание таблиц сопряженности
11.2 Графическое представление таблиц сопряженности
11.3 Статистические критерии для таблиц сопряженности
11.3.1 Тест хи-квадрат
11.3.2 Коэффициенты корреляции
11.3.3 Меры связанности для переменных с номинальной шкалой
11.3.4 Меры связанности для переменных с порядковой шкалой
11.3.5 Другие меры связанности

Часть 12. Анализ множественных ответов
В этой главе мы рассмотрим особенности кодирования и анализа множественных ответов. Вопросы, на которые можно дать несколько ответов одновременно ( это и есть множественные ответы), имеются во многих анкетных исследованиях. Для кодировкии анализа таких множественных ответов SPSS представляет два различных метода: метод множественной дихотомии и категориальный метод. Оба этих метода рассматриваются в последующих разделах на одном и том же примере.

Анализ множественных ответов
12.1 Дихотомный метод
12.1.1 Определение наборов
12.1.2 Частотные таблицы для дихотомических наборов
12.1.3 Таблицы сопряженности с дихотомическими наборами
12.2 Категориальный метод
12.2.1 Определение наборов
12.2.2 Частотные таблицы для категориальных наборов
12.2.3 Таблицы сопряженности с категориальными наборами
12.3 Упражнение
12.4 Сравнение дихотомного и категориального методов

Часть 13. Сравнение средних
Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.

Сравнение средних
13.1 Сравнение двух независимых выборок
13.2. Сравнение двух зависимых выборок
13.3 Сравнение более двух независимых выборок
13.3.1 Разложение на составляющие тренда
13.3.2 Априорные контрасты
13.3.3 Апостериорные тесты
13.3.4 Другие параметры
13.4. Сравнение более чем двух зависимых выборок
13.5 t-тест одной выборки

Часть 14. Непараметрические тесты
Непараметрические (не основанные на каком-либо распределении вероятности) тесты применяются там, где выборки из переменных, принадлежащих к интервальной шкале, не подчиняются нормальному распределению. Так как в этих тестах обрабатывается не само измеренное значение, а его ранг (положение внутри выборки), то эти тесты нечувствительны к выбросам. Непараметрические тесты применяются также в тех случаях, когда переменные относятся к порядковой, а не к интервальной шкале. В меню Analyze (Анализ) Nonparametric Tests (Непараметрические тесты)

Непараметрические тесты
14.1 Сравнение двух независимых выборок
14.1.1 U-тест по методу Манна и Уитни
14.1.2 Тест Мозеса (Moses)
14.1.3 Тест Колмогорова-Смирнова
14.1.4 Тест Уалда-Вольфовица (Wald-Wolfowitz)
14.2 Сравнение двух зависимых выборок
14.2.1 Тест Уилкоксона (Wilcoxon)
14.2.2 Знаковый тест
14.2.3 Тест хи-квадрат по методу МакНемара (McNemar)
14.3 Сравнение более чем двух независимых выборок
14.3.1 Н-тест по методу Крускала и Уоллиса
14.3.2 Медианный тест
14.4 Сравнение более чем двух зависимых выборок
14.4.1 Тест Фридмана
14.4.2 W Кендала
14.4.3 ОКохрана
14.5 Тест Колмогорова-Смирнова для проверки формы распределения
14.6 Отдельный тест по критерию хи-квадрат
14.7 Биномиальный тест
14.8 Анализ последовательностей

Часть 15. Корреляции
В этой главе речь пойдёт о связи (корреляции) между двумя переменными. Расчёты подобных двумерных критериев взаимосвязи основываются на формировании парных значений, которые образовываются из рассматриваемых зависимых выборок. Если в качестве примера мы возьмём данные об уровне холестерина для первых двух моментов времени из исследования гипертонии (файл hyper.sav), то в данном случае следует ожидать довольно сильную связь: большие значения в исходный момент времени являются веским поводом для ожидания больших значений и через 1 месяц.

Корреляции
15.1 Коэффициент корреляции Пирсона
15.2 Ранговые коэффициенты корреляции по Спирману и Кендалу
15.3 Частная корреляция
15.4 Мера расстояния и мера сходства
15.5 Внутриклассовый коэффициент корреляции (Intraclass Correlation Coefficient (ICC))

Часть 16. Регрессионный анализ
Разделы этой главы соответствуют опциям вспомогательного меню. Причём при изучении линейного регрессионного анализа снова будут проведено различие между простым анализом (одна независимая переменная) и множественным анализом (несколько независимых переменных). Собственно говоря, никаких принципиальных отличий между этими видами регрессии нет, однако простая линейная регрессия является простейшей и применяется чаще всех остальных видов.

Регрессионный анализ
16.1 Простая линейная регрессия
16.1.1 Расчёт уравнения регрессии
16.1.2 Сохранение новых переменных
16.1.3 Построение регрессионной прямой
16.1.4 Выбор осей
16.2 Множественная линейная регрессия
16.3 Нелинейная регрессия
16.4 Бинарная логистическая регрессия
16.5 Мультиномиальная логистическая регрессия
16.6 Порядковая регрессия
16.7 Пробит-анализ
16.8 Приближение с помощью кривых
16.9 Взвешенное оценивание (оценка с весами)
16.10 Двухступенчатый метод наименьших квадратов

Часть 17. Дисперсионный анализ
С помощью дисперсионного анализа исследуют влияние одной или нескольких независимых переменных на одну зависимую переменную (одномерный анализ) или на несколько зависимых переменных (многомерный анализ). В обычном случае независимые переменные принимают только дискретные значения (и относятся к номинальной или порядковой шкале); в этой ситуации также говорят о факторном анализе. Если же независимые переменные принадлежат к интервальной шкале или к шкале отношений, то их называют ковариациями, а соответствующий анализ — ковариационным.

Дисперсионный анализ
17.1 Одномерный дисперсионный анализ
17.1.1 Одномерный дисперсионный анализ (общий многофакторный)
17.1.2 Одномерный дисперсионный анализ по методу Фишера (Fisher)
17.1.3 Одномерный дисперсионный анализ с повторным измерением
17.2 Ковариационный анализ
17.3 Многомерный дисперсионный анализ
17.4 Компоненты дисперсии

Часть 18. Дискриминантный анализ
С помощью дискриминантного анализа на основании некоторых признаков (независимых переменных) индивидуум может быть причислен к одной из двух (или к одной из нескольких) заданных заранее групп. Такая постановка задачи, в особенности в случае двух заранее заданных групп, очень сильно напоминает постановку задачи для метода логистической регрессии

Дискриминантный анализ
18.1 Пример из области медицины
18.2 Пример из области социологии
18.3 Пример из области биологии
18.4 Пример из области биологии (три группы)

Часть 19. Факторный анализ
Факторный анализ это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям сводит к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой. Таким образом, целью факторного анализа является нахождение таких комплексных факторов, которые как можно более полно объясняют наблюдаемые связи между переменными, имеющимися в наличии.

Факторный анализ
19.1 Порядок выполнения факторного анализа
19.2 Пример из области социологии
19.3 Пример из области психологии
19.4 Задача вращения

Часть 20. Кластерный анализ
В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений. Под наблюдениями здесь понимаются отдельные личности (респонденты) или любые другие объекты. Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными.

Кластерный анализ
20.1 Принцип кластерного анализа
20.2 Иерархический кластерный анализ
20.2.1 Иерархический кластерный анализ с двумя переменными
20.2.2 Иерархический кластерный анализ с более чем двумя переменными
20.2.3 Иерархический кластерный анализ с предварительным факторным анализом
20.3 Меры расстояния и меры сходства
20.3.1 Переменные, относящиеся к интервальной шкале (метрические переменные)
20.3.2 Частоты
20.3.3 Бинарные переменные
20.4 Методы объединения
20.5 Кластерный анализ при большом количестве наблюдений (Кластерный анализ методом к-средних)

Часть 21. Анализ пригодности
Для этой цели некоторой совокупности (выборке) респондентов предлагают предварительный вариант теста со всеми предполагаемыми заданиями и проводят анализ этих заданий. При помощи этого анализа исключают неподходящие задания, а оставшиеся включают в итоговую форму теста. Тест составленный таким образом должен рассматриваться не как статистический проверочный метод (к примеру, t-тест или U-тест), а как метод исследования личностных признаков.

Анализ пригодности
21.1 Задания типа верно — не верно
21.2 Задания со ступенчатыми ответами

Часть 22. Стандартные графики
Одним из достоинств SPSS для Windows является наличие большого количества разнообразных графиков, которые могу быть построены как при помощи процедур меню графиков, так и из разнообразных процедур меню статистик. Что касается последнего меню, то для выяснения специальных возможностей графического представления Вы можете обратиться к главам: 6 (частотный анализ), 10 (предварительное исследование данных), И (таблицы сопряженности), 16 (регрессионный анализ), 20 (анализ выживания) и 24 (многомерное масштабирование). В главе 4 (Краткий обзор SPSS для Windows) уже были рассмотрены некоторые вопросы построения и редактирования графиков.

Стандартные графики
22.1 Столбчатые диаграммы
22.1.1 Простые столбчатые диаграммы
22.1.2 Кластеризованные столбчатые диаграммы
22.1.3 Состыкованные диаграммы
22.2 Линейчатые диаграммы
22.2.1 Простые линейчатые диаграммы
22.2.2 Сложные линейчатые диаграммы
22.2.3 Связанные линейчатые диаграммы
22.3 Диаграммы с областями
22.3.1 Простая диаграмма с областями
22.3.2 Состыкованные диаграммы с областями
22.4 Круговые диаграммы
22.5 Диаграммы максимальных и минимальных значений
22.5.1 Простые биржевые диаграммы — потолок-пол-закрытие
22.5.2 Кластеризованные диаграммы — максимум-минимум-закрытие
22.5.3 Линейчатые диаграммы разностей
22.5.4 Простые интервальные столбцы
22.5.5 Кластеризованные интервальные столбцы
22.6 Коробчатые диаграммы
22.6.1 Простые коробчатые диаграммы
22.6.2 Кластеризованные коробчатые диаграммы
22.7 Столбики ошибок
22.7.1 Простая диаграмма величины ошибки
22.7.2 Кластеризованная величина ошибки
22.8 Диаграмма рассеяния
22.8.1 Простая диаграмма рассеяния
22.8.2 Матричные диаграммы рассеяния
22.8.3 Наложенные диаграммы рассеяния
22.8.4 Трёхмерные диаграммы рассеяния
22.9 Гистограммы
22.10 Диаграммы Парето
22.11 Контрольные карты
22.12 Диаграммы нормального распределения
22.13 Кривые ROC
22.14 Временные диаграммы и графики последовательностей
22.15 Основы редактирования графиков
22.16 Редактор диаграмм
22.17 Примеры редактирования графиков
22.17.1 Пример первый: изменение наименования осей
22.17.2 Пример второй: редактирование круговой диаграммы
22.17.3 Пример третий: нанесение регрессионных линий

Часть 23. Интерактивные графики
Начиная с 8-ой версии, SPSS предоставляет в распоряжение пользователя так называемые интерактивные графики, которые располагают множеством новых возможностей по сравнению с прежними графиками, теперь уже получившими название стандартных.

Интерактивные графики
23.1 Столбчатые диаграммы
23.1.1 Простая столбчатая диаграмма: отображение частот
23.1.2 Простая столбчатая диаграмма: характеристики метрической переменной
23.1.3 Группированная столбчатая диаграмма
23.1.4 Штабельная столбчатая диаграмма
23.2 Линейчатые диаграммы
23.2.1 Простые линейчатые диаграммы
23.2.2 Сложные линейчатые диаграммы
23.3 Площадные диаграммы
23.4 Круговые диаграммы
23.4.1 Простые круговые диаграммы
23.4.2 Штабельные круговые диаграммы
23.4.3 Рассыпанная круговая диаграмма (рассыпанные круги)
23.5 Коробчатые диаграммы
23.6 Столбчатые диаграммы величины ошибки
23.7 Гистограммы
23.8 Диаграммы рассеяния
23.9 Интерактивные режимы работы с графиками
23.10 Коррекция интерактивных графиков
23.11 Построение диаграммы поданным сводной таблицы

Часть 24. Модуль Tables
Модуль Tables служит для создания таблиц, готовых к презентации. По сравнению с режимом построения частотных таблиц и таблиц сопряженности, а также таблиц средних значений, в этом модуле пользователю предоставляются более широкие возможности. После вызова меню Analyze (Анализ) Custom Tables (Настраиваемые таблицы) На выбор Вам будут предложены четыре вспомогательных меню

Модуль Tables
24.1 Обрабатываемая анкета
24.2 Основные таблицы
24.2.1 Применение нескольких строчных переменных
24.2.2 Добавление второго измерения (столбцовые переменные)
24.2.3 Добавление третьего измерения (табличные переменные)
24.2.4 Вложенные данные
24.2.5 Процентные показатели
24.2.6 Суммарные значения
24.2.7 Средние значения и другие итоговые статистики
24.2.8 Возможности форматирования
24.3 Общие таблицы
24.3.1 Пакетированные и вложенные переменные
24.3.2 Статистики в ячейках
24.3.3 Суммарные показатели
24.4 Обработка множественных ответов
24.4.1 Дихотомический метод
24.4.2 Категориальный метод
24.5 Таблицы частотных показателей
24.5.1 Примеры таблиц частотных показателей
24.5.2 Процентные показатели суммарных значений
24.5.3 Работа с подгруппами

Часть 25. Экспортирование выходных данных
В этой главе мы бы хотели представить Вам важнейшие возможности экспорта основных таблиц и диаграмм в формате SPSS в другие приложения Windows, такие, как например Word

Экспортирование выходных данных
25.1 Перенос статистических результатов в Word
25.2 Перенос диаграмм в Word
25.3 Экспорт сводных таблиц и диаграмм как HTML-документов

Часть 26. Программирование
Пользователи, давно работающие с программой SPSS, в особенности, если им приходилось использовать ее на больших ЭВМ, уже привыкли давать описание данных и формулировать желаемый метод их обработки по строгим синтаксическим правилам в виде некоторой программы на языке SPSS.

Программирование
26.1 Основные синтаксические правила
26.2 Выполнение готовой программы для SPSS
26.2.1 Запуск из редактора синтаксиса
26.2.2 Операционный модуль
26.3 Объединение синтаксиса и диалогового режима
26.4 Программы операций над матрицами
26.5 Сценарии
26.5.1 Применение сценария
26.5.2 Автоматические сценарии
26.5.3 Редактор сценариев

Часть 27. Нововведения в 11-ой версии SPSS
Новая, 11-ая версия SPSS появилась в мае этого года, разумеется в английской локализации. Разработчики пакета сочли, что пользовательский интерфейс в последней версии уже является достаточно совершенным, поэтому подавляющее большинство изменений в новой версии связаны с усовершенствованием или добавлением статистических процедур, которые более полно обеспечивают потребности пользователей в современных методах обработки информации, возникающей в результате маркетинговых исследований, а также исследований в области социологии и психологии.

Использование программы SPSS в качестве ядра для современных маркетинговых исследований
Конкретные нововведения в SPSS 11

Приложение . Обзор процедур SPSS
Статейки

Справочник по Python

В действительности есть несколько модулей Python, предоставляющих доступ к базам данных MySQL и mSQL. В большинстве аспектов они очень схожи между собой. В этой главе приводятся спецификации API для двух наиболее часто используемых модулей. Однако важно указать на приближающуюся унификацию разных API для баз данных в едином API, специфицированном Python Database SIG. В настоящее время mSQL не поддерживает этот API.

Модуль: MySQL
Справочник по JDBC

MySQL- Руководство разработчика

Многие клиенты в дистрибутиве исходного кода MySQL написаны на C. Если Вы ищете примеры, которые показывают, как использовать C API, посмотрите код этих клиентов. Их можно найти в каталоге clients дистрибутива исходного кода MySQL.
Большинство других клиентских API (кроме поддержки Java) использует библиотеку mysqlclient, чтобы связаться с сервером MySQL. Это означает, что, например, Вы можете воспользоваться большинством системных переменных, которые используются другими программами потому, что реально они вызваны из библиотеки.
Пользователь имеет максимальный размер буфера связи. Размер буфера, который распределен первоначально (16 килобайт), автоматически увеличивается до максимального размера (максимум 16 мегабайт). Поскольку размеры буфера растут только по запросу, просто увеличивая заданное по умолчанию максимальное ограничение, Вы не заставите большее количество ресурсов использоваться. Эта проверка размера обычно применяется в сложных ситуациях.

MySQL C API
Какой результат я могу получить из запроса
Что такое Mysql++
Что такое Lua?
MySQLdb: Python-интерфейс для MySQL
MySQL DELPHI API
Краткое описание интерфейса
MySQL Perl API
Добавление новых функций в MySQL
MySQL Ruby Module ver 2.4.2
Библиотека-оболочка mysql для C++
Спецификация Python Database API 2.0
Разработчик пакета
MyDAO: библиотека-оболочка для C++
Модуль MySQLServer
MySQLmodule-1.4
Переменные окружения

Введение в модель данных SQL

В языке отсутствовали средства явной синхронизации доступа к объектам БД со стороны параллельно выполняемых транзакций: с самого начала предполагалось, что необходимую синхронизацию неявно выполняет СУБД.
В настоящее время язык SQL реализован во всех коммерческих реляционных СУБД и почти во всех СУБД, которые изначально основывались не на реляционном подходе. Все компании-производители провозглашают соответствие своей реализации стандарту SQL, и на самом деле реализованные диалекты SQL очень близки. Этого удалось добиться не сразу.
Наиболее близки к System R были две системы компании IBM – SQL/DS и DB22). Разработчики обеих систем использовали опыт проекта System R, а СУБД SQL/DS напрямую основывалась на программном коде System R. Отсюда предельная близость диалектов SQL, реализованных в этих системах, к SQL System R. Из SQL System R были удалены только те части, которые были недостаточно проработаны (например, точки сохранения) или реализация которых вызывала слишком большие технические трудности (например, ограничения целостности и триггеры). Можно назвать этот путь к коммерческой реализации SQL движением сверху вниз.

Краткая история языка SQL
Средства определения, изменения и ликвидации базовых таблиц
Скалярные выражения
Логические выражения раздела WHERE
Внешние соединения
Возможности формулирования аналитических запросов
Базовые средства манипулирования данными
Поддержка авторизации доступа к данным в языке SQL
Истоки и краткая история объектно-реляционных баз данных

Программирование в Microsoft SQL Server 2000

Microsoft SQL Server 2000 – это система управления реляционными базами данных (RDBMS) в топологии клиент/сервер, разработанная для обработки высокопроизводительных сетевых транзакций (OLTP), хранения данных и использования в приложениях электронной коммерции. Курс "Программирование в Microsoft SQL Server 2000 Шаг за шагом" поможет вам быстро освоить принципы создания и манипулирования базами данных с использованием интерактивных средств, входящих в состав SQL Server 2000 версий Personal, Standard и Enterprise.
Внимание! Этот курс предназначен для использования с SQL Server 2000, однако сама система не поставляется вместе с курсом. Прежде, чем приступить к выполнению уроков, вы должны приобрести и установить SQL Server 2000.
Этот курс предназначен как для читателей, вообще не знакомых с реляционными базами данных, так и для тех, которые имеют опыт работы с другими системами управления базами данных, такими как Microsoft Access, и хотели бы перейти к SQL Server 2000. Воспользуйтесь приведенной ниже таблицей, чтобы выбрать для себя план занятий.

С чего начать изучение
Знакомство с Enterprise Manager
Создание резервных копий и восстановление базы данных
Режимы безопасности
Создание баз данных
Создание таблиц
Понятие об индексах
Понятие об отношениях
Понятие о проверочных ограничениях
Понятие об умолчаниях
Понятие о диаграммах баз данных
Использование конструктора запросов Query Designer
Использование оператора SELECT
Фраза ORDER BY
Использование фразы FROM
Оператор SELECT DISTINCT
Понятие о представлениях
Понятие об операторе INSERT
Понятие об операторе UPDATE
Понятие об операторе DELETE
Мастера служб преобразования данных
Понятие о Query Analyzer
Понятие о DDL
Использование Query Analyzer для оптимизации производительности
Команды Transact-SQL
Временные таблицы
Условное выполнение
Понятие о курсорах
Понятие о хранимых процедурах
Понятие о триггерах
Понятие о пользовательских функциях

Базы данных - MySQL - статьи

Слишком часто бизнес обнаруживает, что его инвестиции в высококлассные приложения превращаются в кучу бесполезной информации, которую невозможно интегрировать и анализировать. Это означает, что обещание принять более информированное решение в ситуации временной ограниченности часто остаётся невыполненным. Для того чтобы проанализировать плохо интегрируемые системы организации пользуются несколькими подходами: используют несколько систем отчётности, извлекают и трансформируют данные, создают хранилища данных, либо покупают новые промышленные системы, так как новые системы, обещающие улучшенную работу с отчётностью. Каждое из данных решений имеет свои недостатки - от использования неадекватных инструментов до новых и дорогих проектов консолидирования данных.
В проблемах, испытываемых многими организациями нет ничего нового. К примеру, множество компаний стремится купить программные продукты, такие как SAP для управления основной частью бизнеса. К сожалению, часто данные продукты имеют сложную структуру, мешающую проведению эффективного анализа данных. Компания может иметь совершенно независимые программные системы управления взаимоотношениями с заказчиками (CRM) и системы контроля движения товаров на предприятии (SCM). Ко всему прочему, как правило, обе эти системы содержат информацию, критичную для принятия ключевых решений в бизнесе. Организации также сознают, что для того, чтобы соответствовать множеству отчётным и аналитическим требований они создали массу приложений и хранилищ данных, на основе быстро меняющихся указаний аналитиков, сотрудников по работе с информацией, служащих и пользователей.

Изучение задач бизнеса
Азбука MySQL
Интеллектуальная обработка данных и хранилищ данных в SQL Server 2005
Введение в SQL Server 2005 Integration Services
Введение в MySQL (используя Perl DBI)
Авторизация и аутентификация
MySQL Administrator - рулить СУБД легко
Microsoft SQL Server 2005 Обзор продукта
SQL Server 2005 Reporting Services (SSRS)

*